OpenAI verschiebt Einführung des revolutionären Voice-Modus

Im Mai stellte OpenAI unter anderem einen neuen Sprachmodus für sein generatives KI-Modell ChatGPT vor - und zwar mit einem ungeheuren Realismus in Stimmenimitation und Tonfall. Eigentlich sollte der neue Modus bald starten, doch daraus wird nun nichts.
OpenAI, Sam Altman, Köpfe, Heads, OpenAI CEO

ChatGPT-Sprachmodus

Es geht dabei um die von OpenAI gezeigte Sprachverbesserungen von ChatGPT, bei denen das KI-Modell mit seiner eigenen Stimme antworten kann. Dabei sollte es laut der Pressevorführung auch möglich sein, dass Dramatik - und man könnte schon fast sagen "Emotionen" - in die Sprach-Tonalität gelegt werden. Damit verabschiedet man sich endgültig von roboterartigen Stimmen. Dieser neue Sprachmodus verblüffte und war daher auch ein erwartetes Feature.

Ursprünglich war geplant, den Sprachmodus für einige ChatGPT Plus-Nutzer bis Ende Juni einzuführen. Nun meldet sich OpenAI mit einer neuen Botschaft zu dem Update:

"Wir teilen ein Update zum erweiterten Sprachmodus mit, den wir während unseres Frühjahrs-Updates vorgeführt haben und von dem wir nach wie vor sehr begeistert sind: Wir hatten geplant, diesen in der Alpha-Phase für eine kleine Gruppe von ChatGPT Plus-Benutzern Ende Juni einzuführen, brauchen aber noch einen Monat, um unser Ziel zu erreichen".


Das schreibt der Konzern zumindest auf der Plattform X. Damit sollte es also statt Ende Juni wahrscheinlich Ende Juli werden, bis der öffentliche Test startet.

In einer kurzen Stellungnahme werden auch die Gründe für die Verzögerung erklärt: "Wir verbessern unter anderem die Fähigkeit des Modells, bestimmte Inhalte zu erkennen und abzulehnen. Wir arbeiten auch an der Verbesserung der Nutzererfahrung und bereiten unsere Infrastruktur auf die Skalierung auf Millionen von Nutzern vor, während wir gleichzeitig Echtzeit-Reaktionen aufrechterhalten."

Der aktualisierte Zeitplan sieht nun vor, dass eine kleine Gruppe von Plus-Nutzern den Voice Mode Ende Juli testen kann. Laut OpenAI werden alle Abonnenten von ChatGPT Plus den Sprachmodus dann voraussichtlich irgendwann im Herbst nutzen können.

Bei der Voice Mode-Demo im Mai waren viele der Meinung, dass die von OpenAI erstellte Stimme sehr nach der Schauspielerin Scarlett Johansson klang, die in dem Film Her aus dem Jahr 2013 einen fiktiven KI-Chatbot namens Samantha verkörperte. Ein paar Tage später gab Johansson selbst eine Erklärung ab, in der sie sagte, dass OpenAI versucht habe, sie zu rekrutieren, um ihre Stimme für den Sprachmodus des Unternehmens digitalisieren zu lassen, aber sie abgelehnt habe.

OpenAI hat bisher bestritten, dass die Stimme von "Sky", die in der Voice Mode-Demo verwendet wurde, Johanssons Stimme nachempfunden war. Dennoch hat das Unternehmen beschlossen, die Verwendung dieser digitalen Stimme vorerst zu unterbrechen.

Zusammenfassung
  • OpenAI stellte im Mai einen neuen Sprachmodus für ChatGPT vor
  • Der Sprachmodus beeindruckte mit Realismus in Stimm-Imitation und Tonfall
  • Ursprünglich sollte der Sprachmodus für ChatGPT Plus-Nutzer Ende Juni starten
  • OpenAI verschiebt den Start des Sprachmodus auf Ende Juli
  • Gründe für die Verzögerung sind Verbesserungen der Modellfähigkeiten
  • OpenAI bereitet die Infrastruktur für die Skalierung auf Millionen Nutzer vor
  • Die Stimme in der Demo wurde mit Scarlett Johansson verglichen, was OpenAI bestreitet

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!