Lyrebird: Software imitiert Sprecher nach nur einer Minute Zuhören

Sprache, Lächeln, Mund Bildquelle: Public Domain
Ein kanadisches Startup will die Stimmen beliebiger Menschen klonen können, wenn es nur eine gute Minute an Beispiel-Material des originalen Sprechers zur Verfügung hat. Die ersten Ergebnisse klingen zwar noch nicht perfekt, aber doch hochgradig vielversprechend. Die Technologie dafür stammt von einem Unternehmen namens Lyrebird. Sie basiert natürlich auf selbstlernenden Algorithmen und ähnelt dem, was Adobe im Rahmen seines Project VoCo vorstellte. Was der Software-Konzern als Photoshop für Audio vorstellte, ermöglicht die Manipulation gesprochener Inhalte - allerdings benötigt die Technik immerhin rund 20 Minuten an Beispiel-Material, um sich für ein Imitat trainieren zu können.

Lyrebird bringt mit eben dieser einen Minute bereits ziemlich gute Ergebnisse zustande. Zwar besteht bei diesen noch längst nicht Gefahr, dass sie mit echten Aussagen der natürlichen Person verwechselt werden könnten - man erkennt aber recht klar die imitierte Person. Das zeigt ein - natürlich gefälschtes - Gespräch zwischen Donald Trump, Barack Obama und Hillary Clinton, bei denen diese sich über die kanadische Firma unterhalten.



Auch Gefühle sind möglich

Nach Angaben Lyrebirds kann die Technologie nicht nur stumpf Texte vertonen, sondern abhängig von Inhalt und Kontext auch Gefühle wie Ärger, Stress oder Symphatie mit in den Duktus einbauen. Auch wenn man von Perfektion noch ein gutes Stück entfernt ist, sieht man bei dem Unternehmen große Potenziale für einen praktischen Erfolg der Technologie.

Den Angaben zufolge könnten so beispielsweise Hörbücher oder Animationsfilme mit den Stimmen bekannter Menschen produziert werden, ohne, dass diese selbst an dem jeweiligen Projekt beteiligt sind. Die Technik könnte aber auch Menschen helfen, die aus irgendeinem Grund ihre Stimme verloren, weiter mit vertrautem Klang mit der eigenen Umwelt zu interagieren. Aber auch ein Missbrauch für die Fälschung von Ton-Quellen ist natürlich möglich. Sprache, Lächeln, Mund Sprache, Lächeln, Mund Public Domain
Diese Nachricht empfehlen
Kommentieren12
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!
Einloggen

Jetzt als Amazon Blitzangebot

Ab 06:45 Uhr USB 3.0 Laufwerk KeyUSB 3.0 Laufwerk Key
Original Amazon-Preis
24,99
Im Preisvergleich ab
?
Blitzangebot-Preis
19,54
Ersparnis zu Amazon 22% oder 5,45

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

Tipp einsenden