Microsoft ist aktuell der Weltmeister bei der Spracherkennung

Windows Phone 8.1, Cortana, Halo, Sprachassistent, Halo 4 Bildquelle: Microsoft
Die Forscher bei Microsoft haben einmal mehr Grund zum Feiern: Es gibt derzeit wohl niemanden sonst, dessen Spracherkennungs-Systeme mit einer so geringen Fehlerquote arbeiten. Im Gesamtbild zeigt sich außerdem, welche Fortschritte entsprechende Verfahren in den vergangenen Jahren gemacht haben.

Fortschritte bei der Spracherkennung
Als allgemein anerkannter Benchmark für die Qualität von Systemen zur Spracherkennung steht der so genannte NIST 2000 Switchboard-Test zur Verfügung. Mit diesem werden seit vielen Jahren entsprechende Systeme auf die Probe gestellt. Das beste auf Microsofts Technologie beruhende Einzelsystem brachte es hier auf eine Fehlerquote bei der Erkennung einzelner Wörter von lediglich 6,9 Prozent. In der Kombination zu einem mehrstufigen Verfahren, wie es bei praktischen Anwendungen zum Einsatz kommt, liegt der Wert sogar nur bei 6,3 Prozent.

Als einer der führenden Entwickler von Technologien zur Spracherkennung gilt IBM. Das Unternehmen konnte auf einer Fachkonferenz zum Thema aktuell aber nur eine Fehlerquote von 6,6 Prozent vorweisen, womit sich MIcrosoft an die Spitze gesetzt hat. Zum Vergleich: Vor 20 Jahren war das Beste von NIST ermittelte Ergebnis eine Quote von immerhin 43 Prozent.


Menschliches Niveau ist absehbar

Die Werte gelten jeweils für die normale gesprochene Alltagssprache, in der die normalen Anwender mit Spracherkennungssystemen interagieren. Fehlerquoten von unter 10 Prozent wurden vor über 20 Jahren ausschließlich bei gelesener Sprache erreicht - wenn also der Nutzer Buchseiten oder Zeitungsartikel diktiert. Zwischen beiden ist die Broadcast-Sprache angesiedelt, also jene, die man von professionellen Sprechern in Funk und Fernsehen kennt.

Bei der Alltagssprache gab es im Grunde erst seit Mitte der 1990er Jahre Fortschritte, dann stagnierte die Entwicklung bis vor gut zehn Jahren. Dann aber kamen die ersten Arbeiten zu den neuen KI-Algorithmen für das maschinelle Lernen auf Basis von neuronalen Netzen auf. Seitdem sind die Fehlerquoten wieder rasant gesunken und es ist absehbar, dass Computersysteme bald ein ebenso gutes Sprachverständnis erreichen, wie menschliche Zuhörer. Dies gilt zumindest für die Wörter an sich - die Bedeutung ist dann wieder ein ganz anderes Feld. Windows Phone 8.1, Cortana, Halo, Sprachassistent, Halo 4 Windows Phone 8.1, Cortana, Halo, Sprachassistent, Halo 4 Microsoft
Mehr zum Thema: Microsoft Research
Diese Nachricht empfehlen
Kommentieren33
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!

Jetzt als Amazon Blitzangebot

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

Tipp einsenden