IBM musste Schimpfwort-Filter in Watson einbauen

IBMs Supercomputer Watson hat mit seinen Fähigkeiten, menschliche Sprache zu verstehen, in der letzten Zeit einiges an Aufmerksamkeit erlangt - für die Entwickler gibt es dabei allerdings durchaus auch Fallstricke.

Wie einer der beteiligten Forscher gegenüber dem US-Magazin 'Fortune' berichtete, setzte man sich zum Ziel, die Sprache des Rechners menschlicher zu gestalten. Sie sollte nicht mehr so sehr nach Wörterbuch-Englisch klingen, sondern auch Redewendungen enthalten, wie sie von normalen Menschen im Alltag verwendet werden.

Um dies zu erreichen, kam man auf die Idee, den Rechner mit dem Datenbestand des "Urban Dictionary" zu füttern. Dabei handelt es sich um ein Online-Projekt, in dem Nutzer quasi ihr eigenes Wörterbuch schreiben können. Hier sind unter anderem auch zahlreiche Schimpfwörter und ordinäre oder witzig gemeinte Redewendungen erklärt.


Als die IBM-Entwickler vor zwei Jahren daran gingen, Watson diesen Sprachschatz zu lehren, hielten sie das noch für eine originelle Idee. Inzwischen sieht das anders aus. Denn was sie nicht bedacht haben: Der Mensch lernt im Laufe seiner Entwicklung auch vieles über soziales Verhalten. Dazu gehört auch, zu wissen, in welchen Situationen man sich wie ausdrücken sollte und welches Vokabular, das man sich beispielsweise in der Jugend angeeignet hat, später besser aus dem aktiven Wortschatz verbannt werden sollte.

Und gerade das Urban Dictionary birgt einen reichen Schatz an Begriffen und Redewendungen, die sich höchstens einige übermütige Jugendliche in einschlägigen Foren wie "4chan" gegenseitig an den Kopf werfen. Das Wörterbuch ist voll von rassistischen, sexistischen, homophoben und anderen diskriminierenden Phrasen. Und mangels eines sozialen Bewusstseins streute Watson diese fortan in seine Ausdrucksweise ein.

Wie Brown ausführte, stellte aber nicht nur das Urban Dictionary ein Problem dar. Selbst die Online-Enzyklopädie Wikipedia, mit der Watson ebenfalls gefüttert wurde, enthielt schon ausreichend Slang, mit dem man den Rechner beispielsweise nicht für den Einsatz in Krankenhäusern ausliefern sollte. In mühseliger Arbeit wurde der Wortschatz des Urban Dictionary nun aus den Datenbanken entfernt. Außerdem entwickelten die IBM-Forscher einen Filter, der den Rechner davon abhält, in unpassenden Situationen zu fluchen.
Diese Nachricht empfehlen
Videos zum Thema
 
Tut mir Leid, aber bei dem lesen der News musste ich mich mit dem lachen zurückhalten. Die Arbeitskollegen gucken schon. :'D
 
Cooles Teil :D den möchte ich mal fluchen bzw. quatschen hören.
 
*lach* ich musste mir grade bildlich vorstellen wie das dann klingt wenn die Chefs in der Präsentation sitzen. "Computer liefere mir bitte die aktuellen Daten von letztem Quartal." - PC: "Ey Alder, ich hab grad keine Zeit, such dir deinen Scheiss selbst!"
 
@dodnet: und eine Unterroutine hängt noch an jeden Satz "...du Opfer!" ran :D.
 
"Der Mensch lernt im Laufe seiner Entwicklung auch vieles über soziales Verhalten. Dazu gehört auch, zu wissen, in welchen Situationen man sich wie ausdrücken sollte" Diese These wird automatisch komplett widerlegt wenn man einmal durch die Innenstadt geht und Leuten etwas zuhört/zuschaut.


Alle Kommentare zu dieser News anzeigen

Schreiben Sie uns Ihre Meinung, bewerten Sie Kommentare oder diskutieren Sie mit anderen WinFuture.de Lesern!

Melden Sie sich jetzt kostenlos an
oder verwenden Sie Ihren bestehenden Zugang.

Wöchentlicher Newsletter

Beliebte Videos

powered by veeseo

Jetzt als Amazon Blitzangebot

Ab 13:59Der Hobbit: Eine unerwartete Reise - Extended Edition 3D/2D Sammleredition (5 Discs, inkl. WETA-Statue) [3D Blu-ray]Der Hobbit: Eine unerwartete Reise - Extended Edition 3D/2D Sammleredition (5 Discs, inkl. WETA-Statue) [3D Blu-ray]
Original Amazon-Preis
46,97
Blitzangebot-Preis
39,97
Ersparnis 15% oder 7
Jetzt Kaufen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles