"Schockierend": Web wird mit schlecht übersetzten KI-Inhalten geflutet

Gute Übersetzer-KIs sind heutzutage praktisch und in vielen Lebenssituationen hilfreich, doch selbst auf die besten Tools dieser Art kann man sich nicht zu 100 Prozent verlassen. Die Realität ist aber, dass schlechte Übersetzungen dominieren und das Netz überfluten.
Ki, Künstliche Intelligenz, Cpu, Forschung, Prozessor, Chip, Wissenschaft, AI, Artificial Intelligence, Stockfotos, Science, Wissenschaftler, Gehirn, scientist, Bot, Binärcode, Kopf, Gehirnchip, Binär, Denken, Hirnforschung, Gehirnwellen, Hirnsteuerung, Künstliches Gehirn, Hirn, cyberkinetic, Gedanke, cyberkinetics

KI-Übersetzer sind praktisch, aber nicht fehlerfrei

KI-gestützte Übersetzer und andere Anwendungen dieser Art haben das Netz und die Welt kleiner gemacht. Denn heutzutage kann man praktisch jede Seite auf der Welt besuchen und bekommt zumindest eine relativ gute Ahnung, worum es in einem Text geht. Erfahrene Nutzer wissen allerdings, dass man sich auf derartige Tools nicht blind verlassen sollte.

Doch wie Motherboard berichtet, haben in den letzten Monaten und Jahren KI-Übersetzungen so überhandgenommen, dass man einen "schockierenden" Teil des Internets als maschinell übersetzten Müll bezeichnen kann. Betroffen sind vor allem Sprachen, die Afrika und dem Globalen Süden zugesprochen werden.

Herausgefunden haben dies Forscher des Amazon Web Services AI Lab, laut ihnen wurde rund jeder zweite Satz im Netz in zwei oder mehr Sprachen übersetzt, und zwar mit immer schlechterer Qualität. Dafür verantwortlich ist schlechte maschinelle Übersetzung, so die KI-Forscher von Amazon.


Problem wird per LLMs potenziert

Das ist schon jetzt ein Problem für all jene, die in den jeweiligen Ländern leben, könnte aber noch weitreichendere Folgen haben. Denn auch diese schlechten Übersetzungen (Machine Translation; MT) werden von Large Language Models (LLMs) wie ChatGPT und Co. erfasst, damit lernen die KIs quasi von der schlechten Kopie der schlechten Kopie.

"Wir haben uns für dieses Thema interessiert, weil mehrere Kollegen, die im Bereich MT arbeiten und Muttersprachler von Sprachen mit geringen Ressourcen sind, festgestellt haben, dass ein Großteil des Internets in ihrer Muttersprache MT zu sein scheint", erklärt der an der Studie beteiligte Informatiker Mehak Dhaliwal.

Analysiert wurden rund 6,38 Milliarden Sätze aus dem Internet und 57,1 Prozent der Sätze standen in mindestens drei Sprachen mehrfach zur Verfügung. Die schlechte Qualität zeigte sich vor allem in längeren Sätzen, weil die Qualität von kurzen Sätzen schwerer einzuschätzen ist.

Zusammenfassung
  • Übersetzer-KIs sind praktisch, aber nicht immer zuverlässig
  • Schlechte Übersetzungen überfluten zunehmend das Internet
  • KI-Tools machen globale Inhalte zugänglich, Vorsicht geboten
  • Forschung: Jeder zweite Satz im Netz maschinell übersetzt
  • Afrikanische und globale Südsprachen besonders betroffen
  • Schlechte Übersetzungen beeinflussen Lernprozess von KIs
  • Studie zeigt, 57,1% der Sätze in drei Sprachen mit Qualitätsmängeln

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!