IBM musste Schimpfwort-Filter in Watson einbauen

IBMs Supercomputer Watson hat mit seinen Fähigkeiten, menschliche Sprache zu verstehen, in der letzten Zeit einiges an Aufmerksamkeit erlangt - für die Entwickler gibt es dabei allerdings durchaus auch Fallstricke.
Supercomputer, Ibm, Watson
IBM
Wie einer der beteiligten Forscher gegenüber dem US-Magazin 'Fortune' berichtete, setzte man sich zum Ziel, die Sprache des Rechners menschlicher zu gestalten. Sie sollte nicht mehr so sehr nach Wörterbuch-Englisch klingen, sondern auch Redewendungen enthalten, wie sie von normalen Menschen im Alltag verwendet werden.

Um dies zu erreichen, kam man auf die Idee, den Rechner mit dem Datenbestand des "Urban Dictionary" zu füttern. Dabei handelt es sich um ein Online-Projekt, in dem Nutzer quasi ihr eigenes Wörterbuch schreiben können. Hier sind unter anderem auch zahlreiche Schimpfwörter und ordinäre oder witzig gemeinte Redewendungen erklärt.

Als die IBM-Entwickler vor zwei Jahren daran gingen, Watson diesen Sprachschatz zu lehren, hielten sie das noch für eine originelle Idee. Inzwischen sieht das anders aus. Denn was sie nicht bedacht haben: Der Mensch lernt im Laufe seiner Entwicklung auch vieles über soziales Verhalten. Dazu gehört auch, zu wissen, in welchen Situationen man sich wie ausdrücken sollte und welches Vokabular, das man sich beispielsweise in der Jugend angeeignet hat, später besser aus dem aktiven Wortschatz verbannt werden sollte.

Und gerade das Urban Dictionary birgt einen reichen Schatz an Begriffen und Redewendungen, die sich höchstens einige übermütige Jugendliche in einschlägigen Foren wie "4chan" gegenseitig an den Kopf werfen. Das Wörterbuch ist voll von rassistischen, sexistischen, homophoben und anderen diskriminierenden Phrasen. Und mangels eines sozialen Bewusstseins streute Watson diese fortan in seine Ausdrucksweise ein.

Wie Brown ausführte, stellte aber nicht nur das Urban Dictionary ein Problem dar. Selbst die Online-Enzyklopädie Wikipedia, mit der Watson ebenfalls gefüttert wurde, enthielt schon ausreichend Slang, mit dem man den Rechner beispielsweise nicht für den Einsatz in Krankenhäusern ausliefern sollte. In mühseliger Arbeit wurde der Wortschatz des Urban Dictionary nun aus den Datenbanken entfernt. Außerdem entwickelten die IBM-Forscher einen Filter, der den Rechner davon abhält, in unpassenden Situationen zu fluchen.
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Folgt uns auf Twitter
WinFuture bei Twitter
Interessante Artikel & Testberichte
WinFuture wird gehostet von Artfiles
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!