OpenAI stellt seine sogenannte Voice Engine zum ersten Mal der breiten Öffentlichkeit vor. Mit der KI lassen sich Stimmen von Menschen täuschend echt nachahmen. Dazu ist nicht mehr als eine kurze Audiaufnahme der zu imitierenden Person notwendig.

Künstliche Intelligenz mit Gefahren

Neue Sprachsoftware in der Entwicklung

Risiken sind bekannt

Potenzielle Anwendung

Immer wieder wird heftig über die Chancen, aber auch die Risiken diskutiert, die künstliche Intelligenz mit sich bringt. Von Missachtung der Privatsphäre durch KI-Assistenten bis hin zu drohender Arbeitslosigkeit für Millionen von Menschen. Eine weitere Sorge ist der Missbrauch solcher Technologien, um Personen mit KI-generierten Videos und Bildern zu täuschen. Das kennt man schon von sogenannten Deepfakes.Nun hat OpenAI verraten, dass sie an einer Technologie namens Voice Engine arbeiten, die nun auch Stimmen von echten Menschen nachahmen kann. Alles, was die KI dazu braucht, ist laut dem Unternehmen eine 15-sekündige Aufnahme der Stimme des zu kopierenden menschlichen Sprechers. Damit soll Voice Engine bereits in der Lage sein, "gefühlvolle und realistische Stimmen" zu erzeugen.OpenAI hatte die Voice Engine bereits Ende 2022 entwickelt. Bisher kam sie aber nur im Rahmen von ChatGPT Voice and Read Aloud und als Stimme für Text-to-Speech-Anwendungen zum Einsatz. Jetzt möchte das Unternehmen die Technologie einer breiteren Öffentlichkeit vorstellen und damit "einen Dialog über den verantwortungsvollen Einsatz synthetischer Stimmen und die Anpassung der Gesellschaft an diese neuen Möglichkeiten einleiten".Der Entwickler selbst merkt an, dass es eine große Gefahr in Bezug auf Missbrauch gibt. So können mit einer solchen Technologie extrem einfach Stimmen von Personen nachgeahmt werden, um vermeintliche Aufnahmen von Aussagen zu erzeugen und zu verbreiten, die in Wirklichkeit nie getätigt wurden. OpenAI ist sich dieses Problems eigenen Aussagen zufolge bewusst und hat bereits einige Sicherheitsvorkehrungen getroffen. Dazu gehören unter anderem digitale Wasserzeichen, um die Herkunft der von Voice Engine erzeugten Audiodaten zurückzuverfolgen.Das Unternehmen selbst sieht die Anwendung der KI vor allem in Bereichen wie dem unterstützten Lesen, der Übersetzung von Texten, Hilfe für Menschen, die sich nicht verbal äußern können oder Sprachtraining nach medizinischen Ereignissen wie zum Beispiel einem Schlaganfall.Ob die KI in der Zukunft als eigenständiger Service zum Generieren von Stimmen der breiten Allgemeinheit zur Verfügung gestellt wird, lässt OpenAI momentan noch offen.