Microsoft: Dazwischenquatschen als Durchbruch bei Sprachassistenten

Microsofts Entwickler wollen einen qualitativen Durchbruch bei der Qualität von Sprachsystemen erreicht haben. Der Arbeit lag dabei die Beobachtung zugrunde, dass die Interaktion mit Sprachassistenten nicht nur unnatürlich wirkt, weil diese nur ... mehr... Microsoft, China, Sprachassistent, Xiaolce Bildquelle: Microsoft Microsoft, China, Sprachassistent, Xiaolce Microsoft, China, Sprachassistent, Xiaolce Microsoft

Diese Nachricht vollständig anzeigen.

Jetzt einen Kommentar schreiben
 
Zukünftig werden wir bei unseren Besprechungen (8-12 Leute) noch ein paar Sprachassistenten dazustellen... dann bleiben die Momente, an denen keiner was sagt auch wirklich nicht mehr aus :D :D
 
@bear7: naja, viele reden viel und sagen nichts :)
 
@FuzzyLogic: Für dieses Problem müssen wir gemeinsam eine Lösung finden ^^
 
Das Program schätzt also ab, ab wann die Eingabe des Anwenders unwichtig sind und beginnt mit der Antwort.
Naja, es geht ja nicht um freundliche sondern um nützliche Programme.
 
@erso: Ich bedanke mich trotzdem hin und wieder noch bei meinem Google Home. :D
 
@erso: Der Mensch macht es aber auch so. er legt sich schon ab der mitte des satzes des anderen seine Antwort zurecht. Deswegen ist es auch total verwirrend wenn plötzch ein völlig unerwartetes Word gegen Ende des Waschmaschine auftaucht.
 
@erso: ich glaube es geht nicht nur "explizit" darum, das gegenüber nicht ausreden zu lassen, sondern die Verarbeitungszeit zwischen Satzende und Sprachausgabe...

Also ja, auch das "dazwischensprechen" hat Grundsätzlich was mit Effizienz zu tun, Aber was halt nervt ist:
"wie ist das Wetter heute?"
1 ... 2
"heute morgen ist es leicht bewölkt..."

künftig
"wie ist das wetter [und genau hier fängt der Bot schon an zu 'denken'] heute?"
fließender übergang
"heute morgen ist es leicht ...."

Der Datenflow ist klein genug um das Wetter für die nächsten 20 Tage zu erfragen, d.h. wenn statt heute "unerwartet" nächste Woche kommt, dann wäre das Gerät auch bereit dafür :) ... wenn es aber erst nach dem Satz anfängt zu suchen, ist das Gespräch unnatürlich...

Viel wichtiger als das finde ich aber dass man endlich mehr "beauftragen" kann...
"Hey, trage mir morgen für 15 uhr einen Termin: "Kaffee mit Tante lieschen" ein, dann eine Erinnerung für das nächste Einkaufen "Milch, Honig und Schnaps" und spiele mir meine Lieblingsmusik...

das ganze in einem Flow... ich will keine "interaktion" ich will was sagen und das wird gemacht, ein: "okay" reicht mir ;)
 
@bear7: eine Bestätigung ist manchmal schon ganz praktisch, nur muss sie nicht immer wortwörtlich erfolgen. Bei Musikabspielen reichts, wenn die Musik anfängt zu spielen. Das merkt man schon, wenn die falsche kommt oder gar keine. Da müssten dann aber auch Eingaben verarbeitet werden a la: ich hab gesagt spiel meine Lieblingsmusik, oder: hey, das ist die falsche Playlist.

Bei Einkaufsliste oder Termin wäre eine Bestätigung total nett: ich hab dir morgen 15 Uhr Tante Lieschen eingetragen und auf deine Liste Milch, Honig und Schnaps geschrieben.

Ein wichtiger Punkt in der Interaktion ist, dass die Antworten nicht immer gleiches Wording verwenden. Das wirkt sehr mechanisch, wenn immer kommt: "okay, ich trage dir ein: xyz". Würde ein Mensch auch nie machen.

Man merkt schon, da ist noch ein langer Weg zu gehen, bis sich eine sprachliche Interaktion mit dem Computer natürlich anfühlt.
 
Das unnatürlichste ist doch immer noch, dass ich ein Schlüsselwort sagen muss und eine Kommunikation auf "Schuldeutsch". Wenn ich mit genaue einem Menschen im Raum bin oder genau einen Menschen anschaue sag ich nicht: hey XYZ. Und ich sag auch nicht immer: was ist 187 *24?, sondern: weißt du grad was 187*24 ist?. Die Antwort lautet meist: Google oder Bing aufrufen. Die natürliche Antwort wäre: weiß ich grad nicht, ich google mal.
 
Was aber nichts am konzeptionellen Problem ändert, dass mit einem Sprachassistenten eigtl. gar keine normale Konversation erforderlich wäre, um zum Ziel zu kommen. Es gibt ja keinen Grund, weswegen man mit einer Cortana, Alexa oder Google überhaupt höflich oder mit normalen Sätzen reden sollte. Ein einfaches "Wetter, morgen" geht schneller und tut es auch, weil es direkt und ausschließlich die Schlüsselbegriffe enthält, auf die der Assistent das ausformulierte Gesabbel eh durchsuchen würde. Und der Spielraum für Fehler in der Spracherkennung wird auch deutlich reduziert, wenn man es bei Schlagwörtern belässt.
 
Ich finds gut. Ich komme im Umgang mit Alexa und Co immer ins Stocken, da ich überlegen muss was ich sage damit es verstanden wird. Das wäre dann ja vorbei.
 
ich finde die KI Cortana von Windows Phone Hammer, leider habe ich sie nicht mehr in der Hosentasche. Wenn ich könnte, würde ich mein gutes Huawei gegen ein Lumia 950 tauschen.
Kommentar abgeben Netiquette beachten!
Einloggen

Jetzt als Amazon Blitzangebot

Ab 10:05 Uhr Meross Intelligente Steckdosenleiste Smart Wlan Mehrfachsteckdose mit Überspannungsschutz mit 3 AC Ausgänge und 4 USB Anschlüsse Kompatibel mit Alexa, Google Home und SmartThings mit App FernsteuerungMeross Intelligente Steckdosenleiste Smart Wlan Mehrfachsteckdose mit Überspannungsschutz mit 3 AC Ausgänge und 4 USB Anschlüsse Kompatibel mit Alexa, Google Home und SmartThings mit App Fernsteuerung
Original Amazon-Preis
27,99
Im Preisvergleich ab
27,99
Blitzangebot-Preis
21,41
Ersparnis zu Amazon 24% oder 6,58