Microsoft ist aktuell der Weltmeister bei der Spracherkennung

Die Forscher bei Microsoft haben einmal mehr Grund zum Feiern: Es gibt derzeit wohl niemanden sonst, dessen Spracherkennungs-Systeme mit einer so geringen Fehlerquote arbeiten. Im Gesamtbild zeigt sich außerdem, welche Fortschritte entsprechende Verfahren in den vergangenen Jahren gemacht haben.
Sprachassistent, Windows Phone 8.1, Cortana, Halo, Halo 4
Microsoft

Fortschritte bei der Spracherkennung
Als allgemein anerkannter Benchmark für die Qualität von Systemen zur Spracherkennung steht der so genannte NIST 2000 Switchboard-Test zur Verfügung. Mit diesem werden seit vielen Jahren entsprechende Systeme auf die Probe gestellt. Das beste auf Microsofts Technologie beruhende Einzelsystem brachte es hier auf eine Fehlerquote bei der Erkennung einzelner Wörter von lediglich 6,9 Prozent. In der Kombination zu einem mehrstufigen Verfahren, wie es bei praktischen Anwendungen zum Einsatz kommt, liegt der Wert sogar nur bei 6,3 Prozent.

Als einer der führenden Entwickler von Technologien zur Spracherkennung gilt IBM. Das Unternehmen konnte auf einer Fachkonferenz zum Thema aktuell aber nur eine Fehlerquote von 6,6 Prozent vorweisen, womit sich MIcrosoft an die Spitze gesetzt hat. Zum Vergleich: Vor 20 Jahren war das Beste von NIST ermittelte Ergebnis eine Quote von immerhin 43 Prozent.


Menschliches Niveau ist absehbar

Die Werte gelten jeweils für die normale gesprochene Alltagssprache, in der die normalen Anwender mit Spracherkennungssystemen interagieren. Fehlerquoten von unter 10 Prozent wurden vor über 20 Jahren ausschließlich bei gelesener Sprache erreicht - wenn also der Nutzer Buchseiten oder Zeitungsartikel diktiert. Zwischen beiden ist die Broadcast-Sprache angesiedelt, also jene, die man von professionellen Sprechern in Funk und Fernsehen kennt.

Bei der Alltagssprache gab es im Grunde erst seit Mitte der 1990er Jahre Fortschritte, dann stagnierte die Entwicklung bis vor gut zehn Jahren. Dann aber kamen die ersten Arbeiten zu den neuen KI-Algorithmen für das maschinelle Lernen auf Basis von neuronalen Netzen auf. Seitdem sind die Fehlerquoten wieder rasant gesunken und es ist absehbar, dass Computersysteme bald ein ebenso gutes Sprachverständnis erreichen, wie menschliche Zuhörer. Dies gilt zumindest für die Wörter an sich - die Bedeutung ist dann wieder ein ganz anderes Feld.
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Jetzt als Amazon Blitzangebot
Ab 06:35 Uhr YV 520mb/s USB SticksYV 520mb/s USB Sticks
Original Amazon-Preis
39,99
Im Preisvergleich ab
?
Blitzangebot-Preis
31,99
Ersparnis zu Amazon 20% oder 8
Folgt uns auf Twitter
WinFuture bei Twitter
Interessante Artikel & Testberichte
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!