Microsoft: Dazwischenquatschen als Durchbruch bei Sprachassistenten

Microsoft, China, Sprachassistent, Xiaolce Bildquelle: Microsoft
Microsofts Entwickler wollen einen qualitativen Durchbruch bei der Qualität von Sprachsystemen erreicht haben. Der Arbeit lag dabei die Beobachtung zugrunde, dass die Interaktion mit Sprachassistenten nicht nur unnatürlich wirkt, weil diese nur relativ klare Ansagen verstehen, sondern auch weil sie deutliche Seitenwechsel praktizieren.
Das sieht in der Praxis so aus, dass der Nutzer beispielsweise eine Frage stellt und kurz danach gibt das jeweilige System die gesprochene Antwort aus. Anschließend kann dann mit der nächsten Anfrage eine weitergehende Information abgerufen oder eine Aktion ausgelöst werden. "Menschen reden miteinander aber nicht auf diese Art", erklärte Li Zhou, der das Team zur Entwicklung von Microsofts chinesischem Chatbot XiaoIce leitet.

Seine Gruppe soll es nun aber geschafft haben, ein "Full Duplex"-Sprachsystem zum Laufen zu bringen. Dieses kann im Grunde relativ parallel zuhören und sprechen - so wie es bei menschlichen Konversationen auch häufig der Fall ist. Dialoge sind hier nämlich keine Abfolge abgeschlossener Aussagen beider Gesprächspartner. Wenn man ganz genau hinschaut, wird man erkennen, dass es immer wieder einmal wild durcheinander geht und Überschneidungen auftreten und dies entsprechend auch das Empfinden einer natürlichen Konversation definiert.

Bedeutungsprognosen

Um das nun auch beim Sprachassistenten zu schaffen, mussten nicht nur die Abläufe der Sprachanalyse und Datenverarbeitung im Hintergrund optimiert werden. Das zugrundeliegende KI-System muss vielmehr schon dann, wenn der Nutzer spricht abschätzen, worauf dieser letztlich hinaus will. Und hier kann ein kleiner Trick helfen: Menschliche Aussagen sind selten sehr präzise auf den Punkt gebracht, sondern laufen auch gern mal in einigen eigentlich unnötigen Füllwörtern aus. Das kann sich das System zunutze machen, um im Grunde schon mit der Antwort zu beginnen, bevor der Nutzer scheinbar die Anfrage zu Ende gestellt hat.

In China konnte die Funktionalität bereits in den Praxisbetrieb von Xiaolce übernommen werden. Gemeinsam mit den Kollegen in Redmond und an anderen Standorten Microsofts will das Team nun daran arbeiten, das Verfahren auch in anderen Sprachen verfügbar zu machen. Microsoft, China, Sprachassistent, Xiaolce Microsoft, China, Sprachassistent, Xiaolce Microsoft
Mehr zum Thema: Cortana
Diese Nachricht empfehlen
Kommentieren12
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!
Einloggen

Jetzt als Amazon Blitzangebot

Ab 12:55 Uhr ibowin® M130 3G Cellular Tablet PC 10.1 Zoll 1280x800 IPS 1G RAM 16G ROM MediaTek Quad Core, 3G WCDMA / 2G GSM 2SIM Anruf Calling PC AGPS Bluetooth WIFIibowin® M130 3G Cellular Tablet PC 10.1 Zoll 1280x800 IPS 1G RAM 16G ROM MediaTek Quad Core, 3G WCDMA / 2G GSM 2SIM Anruf Calling PC AGPS Bluetooth WIFI
Original Amazon-Preis
82,99
Im Preisvergleich ab
82,99
Blitzangebot-Preis
63,74
Ersparnis zu Amazon 23% oder 19,25
Im WinFuture Preisvergleich

Tipp einsenden