OpenAI verschiebt Einführung des revolutionären Voice-Modus

Im Mai stellte OpenAI unter anderem einen neuen Sprachmodus für sein generatives KI-Modell ChatGPT vor - und zwar mit einem ungeheuren Realismus in Stimmenimitation und Tonfall. Eigentlich sollte der neue Modus bald starten, doch daraus wird nun nichts.

Nadine Dressler, 26.06.2024 17:55 Uhr

OpenAI, Sam Altman, Köpfe, Heads, OpenAI CEO

ChatGPT-Sprachmodus

Es geht dabei um die von OpenAI gezeigte Sprachverbesserungen von ChatGPT, bei denen das KI-Modell mit seiner eigenen Stimme antworten kann. Dabei sollte es laut der Pressevorführung auch möglich sein, dass Dramatik - und man könnte schon fast sagen "Emotionen" - in die Sprach-Tonalität gelegt werden. Damit verabschiedet man sich endgültig von roboterartigen Stimmen. Dieser neue Sprachmodus verblüffte und war daher auch ein erwartetes Feature.

Ursprünglich war geplant, den Sprachmodus für einige ChatGPT Plus-Nutzer bis Ende Juni einzuführen. Nun meldet sich OpenAI mit einer neuen Botschaft zu dem Update:

"Wir teilen ein Update zum erweiterten Sprachmodus mit, den wir während unseres Frühjahrs-Updates vorgeführt haben und von dem wir nach wie vor sehr begeistert sind: Wir hatten geplant, diesen in der Alpha-Phase für eine kleine Gruppe von ChatGPT Plus-Benutzern Ende Juni einzuführen, brauchen aber noch einen Monat, um unser Ziel zu erreichen".

Das schreibt der Konzern zumindest auf der Plattform X. Damit sollte es also statt Ende Juni wahrscheinlich Ende Juli werden, bis der öffentliche Test startet.

In einer kurzen Stellungnahme werden auch die Gründe für die Verzögerung erklärt: "Wir verbessern unter anderem die Fähigkeit des Modells, bestimmte Inhalte zu erkennen und abzulehnen. Wir arbeiten auch an der Verbesserung der Nutzererfahrung und bereiten unsere Infrastruktur auf die Skalierung auf Millionen von Nutzern vor, während wir gleichzeitig Echtzeit-Reaktionen aufrechterhalten."

Der aktualisierte Zeitplan sieht nun vor, dass eine kleine Gruppe von Plus-Nutzern den Voice Mode Ende Juli testen kann. Laut OpenAI werden alle Abonnenten von ChatGPT Plus den Sprachmodus dann voraussichtlich irgendwann im Herbst nutzen können.

Bei der Voice Mode-Demo im Mai waren viele der Meinung, dass die von OpenAI erstellte Stimme sehr nach der Schauspielerin Scarlett Johansson klang, die in dem Film Her aus dem Jahr 2013 einen fiktiven KI-Chatbot namens Samantha verkörperte. Ein paar Tage später gab Johansson selbst eine Erklärung ab, in der sie sagte, dass OpenAI versucht habe, sie zu rekrutieren, um ihre Stimme für den Sprachmodus des Unternehmens digitalisieren zu lassen, aber sie abgelehnt habe.

OpenAI hat bisher bestritten, dass die Stimme von "Sky", die in der Voice Mode-Demo verwendet wurde, Johanssons Stimme nachempfunden war. Dennoch hat das Unternehmen beschlossen, die Verwendung dieser digitalen Stimme vorerst zu unterbrechen.

Zusammenfassung

OpenAI stellte im Mai einen neuen Sprachmodus für ChatGPT vor
Der Sprachmodus beeindruckte mit Realismus in Stimm-Imitation und Tonfall
Ursprünglich sollte der Sprachmodus für ChatGPT Plus-Nutzer Ende Juni starten
OpenAI verschiebt den Start des Sprachmodus auf Ende Juli
Gründe für die Verzögerung sind Verbesserungen der Modellfähigkeiten
OpenAI bereitet die Infrastruktur für die Skalierung auf Millionen Nutzer vor
Die Stimme in der Demo wurde mit Scarlett Johansson verglichen, was OpenAI bestreitet

Siehe auch:

Thema:

Künstliche Intelligenz

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren3

Hinweis einsenden

Weitere Nachrichten zum Thema OpenAI verbrennt Geld im Rekordtempo, könnte schon bald pleite seinToys 'R' Us: Erster Image-Film komplett aus dem OpenAI-Tool SoraGPT-4o mini: OpenAIs neues KI-Modell spart Kosten bei mehr LeistungOpenAI plant Blockade: Schlupflöcher für China & Co. vor dem Aus?ChatGPT in MacOS und iOS: Apple nutzt OpenAI-Chatbot einfach gratisViel Lärm um nichts: Elon Musk zieht seine Klage gegen OpenAI zurück