Lyrebird: Software imitiert Sprecher nach nur einer Minute Zuhören

Ein kanadisches Startup will die Stimmen beliebiger Menschen klonen können, wenn es nur eine gute Minute an Beispiel-Material des originalen Sprechers zur Verfügung hat. Die ersten Ergebnisse klingen zwar noch nicht perfekt, aber doch hochgradig vielversprechend.

Christian Kahle, 25.04.2017 14:43 Uhr

Public Domain

Die Technologie dafür stammt von einem Unternehmen namens Lyrebird. Sie basiert natürlich auf selbstlernenden Algorithmen und ähnelt dem, was Adobe im Rahmen seines Project VoCo vorstellte. Was der Software-Konzern als Photoshop für Audio vorstellte, ermöglicht die Manipulation gesprochener Inhalte - allerdings benötigt die Technik immerhin rund 20 Minuten an Beispiel-Material, um sich für ein Imitat trainieren zu können.

Lyrebird bringt mit eben dieser einen Minute bereits ziemlich gute Ergebnisse zustande. Zwar besteht bei diesen noch längst nicht Gefahr, dass sie mit echten Aussagen der natürlichen Person verwechselt werden könnten - man erkennt aber recht klar die imitierte Person. Das zeigt ein - natürlich gefälschtes - Gespräch zwischen Donald Trump, Barack Obama und Hillary Clinton, bei denen diese sich über die kanadische Firma unterhalten.

Auch Gefühle sind möglich

Nach Angaben Lyrebirds kann die Technologie nicht nur stumpf Texte vertonen, sondern abhängig von Inhalt und Kontext auch Gefühle wie Ärger, Stress oder Symphatie mit in den Duktus einbauen. Auch wenn man von Perfektion noch ein gutes Stück entfernt ist, sieht man bei dem Unternehmen große Potenziale für einen praktischen Erfolg der Technologie.

Den Angaben zufolge könnten so beispielsweise Hörbücher oder Animationsfilme mit den Stimmen bekannter Menschen produziert werden, ohne, dass diese selbst an dem jeweiligen Projekt beteiligt sind. Die Technik könnte aber auch Menschen helfen, die aus irgendeinem Grund ihre Stimme verloren, weiter mit vertrautem Klang mit der eigenen Umwelt zu interagieren. Aber auch ein Missbrauch für die Fälschung von Ton-Quellen ist natürlich möglich.

Thema:

Internet & Webdienste

Kommentieren12

Hinweis einsenden

Weitere Nachrichten zum Thema Samsung bringt Bixby erst Ende des Jahres auch in deutscher SpracheDeep Voice: Extrem realistische Sprache in Echtzeit generiertMicrosoft-KI schlägt Transkriptions-Profis bei der Spracherkennung