IBM musste Schimpfwort-Filter in Watson einbauen

Ibm, Supercomputer, Watson Bildquelle: IBM
IBMs Supercomputer Watson hat mit seinen Fähigkeiten, menschliche Sprache zu verstehen, in der letzten Zeit einiges an Aufmerksamkeit erlangt - für die Entwickler gibt es dabei allerdings durchaus auch Fallstricke. Wie einer der beteiligten Forscher gegenüber dem US-Magazin 'Fortune' berichtete, setzte man sich zum Ziel, die Sprache des Rechners menschlicher zu gestalten. Sie sollte nicht mehr so sehr nach Wörterbuch-Englisch klingen, sondern auch Redewendungen enthalten, wie sie von normalen Menschen im Alltag verwendet werden.

Um dies zu erreichen, kam man auf die Idee, den Rechner mit dem Datenbestand des "Urban Dictionary" zu füttern. Dabei handelt es sich um ein Online-Projekt, in dem Nutzer quasi ihr eigenes Wörterbuch schreiben können. Hier sind unter anderem auch zahlreiche Schimpfwörter und ordinäre oder witzig gemeinte Redewendungen erklärt.

Als die IBM-Entwickler vor zwei Jahren daran gingen, Watson diesen Sprachschatz zu lehren, hielten sie das noch für eine originelle Idee. Inzwischen sieht das anders aus. Denn was sie nicht bedacht haben: Der Mensch lernt im Laufe seiner Entwicklung auch vieles über soziales Verhalten. Dazu gehört auch, zu wissen, in welchen Situationen man sich wie ausdrücken sollte und welches Vokabular, das man sich beispielsweise in der Jugend angeeignet hat, später besser aus dem aktiven Wortschatz verbannt werden sollte.

Und gerade das Urban Dictionary birgt einen reichen Schatz an Begriffen und Redewendungen, die sich höchstens einige übermütige Jugendliche in einschlägigen Foren wie "4chan" gegenseitig an den Kopf werfen. Das Wörterbuch ist voll von rassistischen, sexistischen, homophoben und anderen diskriminierenden Phrasen. Und mangels eines sozialen Bewusstseins streute Watson diese fortan in seine Ausdrucksweise ein.

Wie Brown ausführte, stellte aber nicht nur das Urban Dictionary ein Problem dar. Selbst die Online-Enzyklopädie Wikipedia, mit der Watson ebenfalls gefüttert wurde, enthielt schon ausreichend Slang, mit dem man den Rechner beispielsweise nicht für den Einsatz in Krankenhäusern ausliefern sollte. In mühseliger Arbeit wurde der Wortschatz des Urban Dictionary nun aus den Datenbanken entfernt. Außerdem entwickelten die IBM-Forscher einen Filter, der den Rechner davon abhält, in unpassenden Situationen zu fluchen. Ibm, Supercomputer, Watson Ibm, Supercomputer, Watson IBM
Diese Nachricht empfehlen
Kommentieren22
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!

Wöchentlicher Newsletter

Jetzt als Amazon Blitzangebot

Ab 17:59uRage Exodus² Gaming Tastatur Keyboard-uRage Exodus² Gaming Tastatur Keyboard-
Original Amazon-Preis
27,89
Blitzangebot-Preis
19,89
Ersparnis 29% oder 8
Jetzt Kaufen
Im WinFuture Preisvergleich

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles

Tipp einsenden