Computer-Übersetzung: Vektoren statt Wörterbücher

Android, Apple, App, Tool, Übersetzung, Google Translate Bildquelle: Google
Informatiker bei Google wollen bei der maschinellen Übersetzung von Texten jetzt ein neues Konzept einsetzen, das deutlich bessere Ergebnisse verspricht und kaum noch Starthilfe von Experten benötigt.
Bisher war die Basis eines entsprechenden Programms stets ein klassisches Wörterbuch. Durch die Erweiterung um Grammatik-Regeln und verschiedener Besonderheiten der jeweiligen Sprachen wurden die Ergebnisse zwar immer besser, sind aber noch weit von einer wirklich guten Übersetzung entfernt. Vor allem die feinen Unterschiede bei den Bedeutungen der Wörter bereiteten hier immer wieder Probleme.

Bei Google arbeitet man nun an einem Verfahren, bei dem sogar die Wörterbücher selbst komplett automatisiert erstellt werden, berichtete das Magazin Technology Review. Dafür sollen nicht einmal direkte Übersetzungen der gleichen Texte benötigt werden. Statt dessen will man mit Data Mining-Techniken die Strukturen von Sprachen analysieren und diese miteinander in Verbindung bringen.

Die grundlegende Idee hinter dem Ansatz besteht darin, dass in verschiedenen Sprachen im Grunde die gleichen Dinge abgebildet werden. So gibt es beispielsweise Wörter für konkrete Dinge - wie beispielsweise Tiere wie Katzen, Hunde oder Kühe. Im nächsten Schritt werden diese auch in ähnliche Beziehungen miteinander gesetzt, wie etwa in dem Satz: "Eine Katze ist ein Tier, das kleiner als ein Hund ist."

Solche Verbindungen tauchen auch bei vielen anderen Begriffen auf - sei es bei Zahlen oder den Adjektiven, die mit Substantiven in Verbindung gebracht werden. Linguisten haben in den vergangenen Jahren bereits deutliche Fortschritte darin gemacht, die Ähnlichkeit solcher Beziehungen in verschiedenen Sprachen über Vektor-Mathematik herauszuarbeiten.

Es zeigte sich, dass in vielen verschiedenen Idiomen Wörter über ähnliche Vektoren miteinander in Beziehung stehen. So kann aus dem linguistischen Problem bei der Übersetzung ein mathematisches gemacht werden - was wiederum für die Bearbeitung mit dem Computer deutlich besser nutzbar wäre.

Bereits jetzt wurden mit der neuen Methode recht gute Ergebnisse erzielt, wussten die Google-Entwickler zu berichten. Mit ihr sei es beispielsweise auch gelungen, in dem bestehenden Übersetzungs-Algorithmus zwischen Englisch und Tschechisch eine Reihe von Fehlern ausfindig zu machen. Auch könne man schon deutlich bessere Ergebnisse bei der Gegenüberstellung von Sprachen erzielen, die nicht einen relativ ähnlichen historischen und kulturellen Hintergrund haben. Sprache, Lexikon, Wörterbuch Sprache, Lexikon, Wörterbuch
Diese Nachricht empfehlen
Kommentieren24
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!

Jetzt als Amazon Blitzangebot

Ab 00:00 Uhr Symantec Norton Security Deluxe (5 Geräte) mit Norton Utilities 16.0 Bundle
Symantec Norton Security Deluxe (5 Geräte) mit Norton Utilities 16.0 Bundle
Original Amazon-Preis
29,30
Im Preisvergleich ab
29,30
Blitzangebot-Preis
23,99
Ersparnis zu Amazon 18% oder 5,31

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles

Tipp einsenden