Software erkennt Texte mit ähnlicher Bedeutung

Eine an der Technischen Universität Darmstadt entwickelte Software kann die Bedeutungen von Texten verstehen und erkennt zuverlässig ähnliche Aussagen in ähnlichen Schriftstücken - auch, wenn sie in anderen Worten ausgedrückt werden. Das teilten die Entwickler des Algorithmus mit.
Für Computer sind freie Texte im Regelfall nicht mehr als eine Sequenz bestimmter Zeichen. Die Bedeutung dieser Zeichenketten, deren Semantik, bleibt den Rechnern bisher verborgen. Daher können sie bislang nur bedingt sinnvolle Übersetzungen anfertigen und auch nicht erkennen, wenn zwei Texte den gleichen Sachverhalt mit anderen Worten beschreiben.

Um Rechnern beizubringen, dass etwa bei einem Hochwasser ein "sinkender Wasserstand" die gleiche Bedeutung hat wie die Aussage, der Pegel habe "seinen Scheitelpunkt überschritten", haben Informatiker des Ubiquitous Knowledge Processing (UKP) Lab an der TU Darmstadt eine Software entwickelt und diese mit Hilfe eines maschinellen Lernverfahrens trainiert.

Anhand konkreter Texteigenschaften erschließt die Software die Bedeutung eines Textes und bestimmt aus einer Fülle von möglichen Indikatoren automatisch semantisch ähnliche Texte - auch wenn diese sich auf der Ebene der Zeichenketten, also der konkreten Worte, stark unterscheiden. Dazu nutzen die Wissenschaftler unter anderem maschinenlesbare Wörterbücher, so genannte Wortnetze, sowie komplexe Modelle, die Texte in einem hochdimensionalen mathematischen Vektorraum repräsentieren und vergleichen.

"Unser System funktioniert nicht nur auf bestimmten Daten, sondern ist mittlerweile auch auf vorab unbekannten Daten sehr solide einsetzbar", berichtete die Leiterin des UKP Lab Iryna Gurevych. Beim internationalen Wettbewerb Semantic Evaluation 2012 erzielte die Software bei der Aufgabe "Bestimmung semantischer Ähnlichkeit von Texten" unter 35 konkurrierenden Teams die beste Leistung.

Die Software soll zahlreiche Anwendungsmöglichkeiten haben: Unter anderem könnten Leser Empfehlungen für thematisch verwandte Dokumente erhalten und die Freitextantworten in groß angelegten Umfragen oder internationalen Kompetenzmessungen wie der PISA-Studie mit deutlich geringerem Aufwand ausgewertet werden. Text Text
Diese Nachricht empfehlen
Kommentieren20
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!

Jetzt als Amazon Blitzangebot

Ab 18:00 Uhr Samsung 40 Zoll Fernseher (Ultra HD, Triple Tuner, Smart TV)
Samsung 40 Zoll Fernseher (Ultra HD, Triple Tuner, Smart TV)
Original Amazon-Preis
559,99
Im Preisvergleich ab
529,00
Blitzangebot-Preis
499,00
Ersparnis zu Amazon 11% oder 60,99

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles

Tipp einsenden