Microsofts Spracherkennung nur noch mit 5,1 Prozent Fehlerrate

Windows Phone 8.1, Cortana, Sprachassistent Bildquelle: The Verge
Microsofts Technologie zur automatischen Spracherkennung konnte weiter verbessert werden. Die Fehlerrate bei der Erkennung von Konversationstext beträgt mittlerweile nur noch 5,1 Prozent. Bereits im letzten Jahr hat Mi­cro­soft die Konkurrenz in Sachen Spracherkennung hinter sich gelassen und kann seinen Vorsprung nun ausbauen.
Zur Messung der Erkennungsrate für Konversationstext in Englisch kommt als Quasi-Stan­dard der so genannte NIST 2000 Switchboard-Test zum Einsatz. Darin erreichte Mi­cro­soft bereits letztes Jahr eine sehr niedrige Fehlerquote von 5,9 Prozent. Die erneute Ver­bes­se­rung von 0,8 Prozentpunkten mag manchem als nicht groß erscheinen. Da sich die Sys­teme inzwischen allerdings der Perfektion annähern, ist die erreichte Optimierung be­acht­lich. Die Erkennungsrate ist mittlerweile genauso hoch oder sogar höher wie die bei pro­fes­sio­nel­len menschlichen Transkriptionen.


Analyse von Telefongesprächen

Für den von Microsoft AI und Microsoft Research durchgeführten Switchboard-Test musste die Erkennungstechnik 2.400 Telefonunterhaltungen über Sport und Politik automatisch in Text umwandeln. Die Ergebnisse wurden mit denen von menschlichen Transkriptionisten verglichen, welche die Aufnahmen mehrfach anhören und sich mit einander austauschen durften.

Spracherkennung für Cortana und Co.

Microsofts Spracherkennung kommt im so ge­nann­ten Cognitive Toolkit (CNTK) zum Ein­satz welches für Cortana, den Skype Über­set­zer, den PowerPoint Presentation Translator und andere Software verwendet wird. Auch App-Entwickler können die exzellente Sprach­er­ken­nung so in ihre eigene Software integrieren.

Die hohen Erkennungsraten werden mit Hilfe neuronaler Netze und Sprachmodellen erreicht. Im Vergleich zum Vorjahr kommt darin jetzt auch ein so genannter bi-direktionaler Sprach­spei­cher zum Einsatz, welcher den Kontext von aktuell gesprochenen Sätzen und von länger zurückliegendem Text analysiert. Bei der automatischen Spracherkennung gab es in den letzten zehn Jahren durch den Einsatz komplexer KI-Systeme einen regelrechten Durchbruch. Vor zwanzig Jahren lag die Fehlerquote beim besten NIST Switchboard-Test noch bei 43 Prozent.


Windows Phone 8.1, Cortana, Sprachassistent Windows Phone 8.1, Cortana, Sprachassistent The Verge
Mehr zum Thema: Cortana
Diese Nachricht empfehlen
Kommentieren12
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!
Einloggen

Jetzt als Amazon Blitzangebot

Ab 12:40 Uhr PUMPKIN Autoradio DVD Player für VW Golf Touran Polo Beetle Passat SEAT SKODA mit Navi 7 Zoll Bildschirm Unterstützt Bluetooth USB CD SD Rückfahrkamera CanBus Lenkradsteurung 2 DINPUMPKIN Autoradio DVD Player für VW Golf Touran Polo Beetle Passat SEAT SKODA mit Navi 7 Zoll Bildschirm Unterstützt Bluetooth USB CD SD Rückfahrkamera CanBus Lenkradsteurung 2 DIN
Original Amazon-Preis
279,99
Im Preisvergleich ab
279,99
Blitzangebot-Preis
237,99
Ersparnis zu Amazon 15% oder 42
Im WinFuture Preisvergleich

Tipp einsenden