Computer-Übersetzung:
Vektoren statt Wörterbücher

Informatiker bei Google wollen bei der maschinellen Übersetzung von Texten jetzt ein neues Konzept einsetzen, das deutlich bessere Ergebnisse verspricht und kaum noch Starthilfe von Experten benötigt.
Apple, Android, App, Tool, Übersetzung, Google Translate
Google
Bisher war die Basis eines entsprechenden Programms stets ein klassisches Wörterbuch. Durch die Erweiterung um Grammatik-Regeln und verschiedener Besonderheiten der jeweiligen Sprachen wurden die Ergebnisse zwar immer besser, sind aber noch weit von einer wirklich guten Übersetzung entfernt. Vor allem die feinen Unterschiede bei den Bedeutungen der Wörter bereiteten hier immer wieder Probleme.

Bei Google arbeitet man nun an einem Verfahren, bei dem sogar die Wörterbücher selbst komplett automatisiert erstellt werden, berichtete das Magazin Technology Review. Dafür sollen nicht einmal direkte Übersetzungen der gleichen Texte benötigt werden. Statt dessen will man mit Data Mining-Techniken die Strukturen von Sprachen analysieren und diese miteinander in Verbindung bringen.

Die grundlegende Idee hinter dem Ansatz besteht darin, dass in verschiedenen Sprachen im Grunde die gleichen Dinge abgebildet werden. So gibt es beispielsweise Wörter für konkrete Dinge - wie beispielsweise Tiere wie Katzen, Hunde oder Kühe. Im nächsten Schritt werden diese auch in ähnliche Beziehungen miteinander gesetzt, wie etwa in dem Satz: "Eine Katze ist ein Tier, das kleiner als ein Hund ist."

Solche Verbindungen tauchen auch bei vielen anderen Begriffen auf - sei es bei Zahlen oder den Adjektiven, die mit Substantiven in Verbindung gebracht werden. Linguisten haben in den vergangenen Jahren bereits deutliche Fortschritte darin gemacht, die Ähnlichkeit solcher Beziehungen in verschiedenen Sprachen über Vektor-Mathematik herauszuarbeiten.

Es zeigte sich, dass in vielen verschiedenen Idiomen Wörter über ähnliche Vektoren miteinander in Beziehung stehen. So kann aus dem linguistischen Problem bei der Übersetzung ein mathematisches gemacht werden - was wiederum für die Bearbeitung mit dem Computer deutlich besser nutzbar wäre.

Bereits jetzt wurden mit der neuen Methode recht gute Ergebnisse erzielt, wussten die Google-Entwickler zu berichten. Mit ihr sei es beispielsweise auch gelungen, in dem bestehenden Übersetzungs-Algorithmus zwischen Englisch und Tschechisch eine Reihe von Fehlern ausfindig zu machen. Auch könne man schon deutlich bessere Ergebnisse bei der Gegenüberstellung von Sprachen erzielen, die nicht einen relativ ähnlichen historischen und kulturellen Hintergrund haben.
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Interessante Artikel & Testberichte
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!