Mit Emotionen und Lip-Sync:
YouTube startet neue KI-Synchronisation

YouTube möchte Sprachbarrieren einreißen: Eine neue KI-Syn­chro­ni­sa­tion ist ab sofort für alle Nutzer weltweit verfügbar. Neue Fea­tures wie "Expressive Speech" sollen für echte Emotionen sorgen, wäh­rend eine Testfunktion sogar Lippenbewegungen anpasst.
Videoplattform, Youtube, Google YouTube, YouTuber, YouTube Logo

KI-Dubbing für alle Kanäle verfügbar

YouTube hat seine auf künstlicher Intelligenz basierende automatische Synchronisationsfunktion umfassend erweitert und ab sofort für alle Creator freigeschaltet. Damit können Videos automatisch in bis zu 27 verschiedene Sprachen übersetzt werden, ohne dass Produzenten manuell Audiospuren hochladen müssen.

Für Content-Ersteller, die ein globales Publikum erreichen wollen, ist besonders die Einführung von "Expressive Speech" relevant. Die Technologie zielt darauf ab, nicht nur den reinen Informationsgehalt, sondern auch die Intonation, Betonung und subtile Emotionen des Sprechers präzise in die Zielsprache zu übertragen.

Das Feature steht aktuell in acht Sprachen zur Verfügung, darunter Deutsch, Englisch, Französisch und Spanisch. Das erklärte Ziel der Entwicklung ist es, die oft monoton und roboterhaft klingenden KI-Stimmen früherer Generationen durch dynamische, dem Originalton nachempfundene Audiospuren zu ersetzen.

Zusätzlich implementiert YouTube "Smart Filtering". Diese Erkennungsroutine sorgt dafür, dass Segmente ohne Sprachfokus - wie Musikvideos oder stille Vlogs - automatisch vom Dubbing-Prozess ausgeschlossen bleiben, um die akustische Authentizität des Inhalts zu wahren.


Lippensynchronität im Testlauf

Wie YouTube in einem aktuellen Blogbeitrag ausführt, arbeitet das Unternehmen bereits am nächsten Schritt der Immersion. Eine Pilotfunktion namens "Lip Sync" befindet sich derzeit in der Testphase. Die Technologie passt die Lippenbewegungen der Protagonisten im Video subtil an die übersetzte Audiospur an, um die visuelle Diskrepanz zwischen Bild und Ton zu minimieren.

Sollte sich dieses Feature bewähren, könnte es die Wahrnehmung fremdsprachiger Inhalte, wie etwa technischer Dokumentationen oder Keynotes, erheblich verändern, indem es den sogenannten "Uncanny Valley"-Effekt reduziert.

Für Nutzer wurde die Kontrolle über die Wiedergabe zudem detaillierter gestaltet. Über die Einstellungen unter "Wiedergabe und Leistung" lassen sich nun bevorzugte Sprachen definieren. Das System wählt daraufhin automatisch die passende Audiospur aus, sofern diese verfügbar ist. Wer die Originalstimme bevorzugt, kann die KI-Synchronisation dort auch priorisieren oder umgehen.

Creator behalten ebenfalls die Hoheit über ihre Inhalte: Sie können die automatische Übersetzung jederzeit deaktivieren oder durch eigene, professionelle Synchronfassungen ersetzen, falls die Qualität der KI für spezifische Anforderungen nicht ausreicht.

Werdet ihr die neuen KI-Features nutzen, um internationale Inhalte zu schauen, oder bleibt ihr lieber beim englischen Original? Wir sind gespannt auf eure Perspektive. Schreibt es uns in die Kommentare!

Zusammenfassung
  • YouTubes KI-basierte Synchronisationsfunktion für 27 Sprachen freigegeben
  • Neue 'Expressive Speech' Technologie überträgt Intonation und Emotionen
  • Feature verfügbar in acht Sprachen einschließlich Deutsch und Englisch
  • 'Smart Filtering' schließt Segmente ohne Sprachfokus automatisch aus
  • Funktion 'Lip Sync' passt Lippenbewegungen an übersetzte Audiospuren an
  • Nutzer können bevorzugte Sprachen in den Wiedergabeeinstellungen festlegen
  • Creator behalten volle Kontrolle und können KI-Synchronisation deaktivieren

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!