ChatGPT-Macher zeigen erstmals ihre Text-zu-Video-KI "Sora"

Die ChatGPT-Betreiber von OpenAI haben jetzt ein neues System namens Sora vorgestellt. Dabei handelt es sich um ein generatives KI-Modell, dass Texteingaben in Videos umwandeln kann, die aktuell bis zu eine Minute lang sein können.
OpenAI, ChatGPT

Modell im Extrem-Test

Laut dem zugehörigen OpenAI-Forschungspapier wird das neue Sora-Modell mit "textbedingten Diffusionsmodellen auf Videos und Bildern mit variabler Dauer" trainiert, um hyperrealistische Videos aus textbasierten Aufforderungen zu erzeugen. Das Unternehmen merkte an, dass es beim KI-Training darauf Wert gelegt hat, "die physische Welt in Bewegung zu verstehen".

Sowohl in der Ankündigung als auch in der Forschungsarbeit wurden eine Reihe von Clips gezeigt, in denen das Modell vorgestellt wird. OpenAI-Chef Sam Altman nahm sogar Anfragen von Benutzern entgegen, um die Fähigkeiten des Modells zu zeigen.

Öffentlich verfügbar ist das Modell allerdings bis jetzt nicht. OpenAI wies darauf hin, dass man derzeit mit Red-Teamern zusammenarbeite, um die Grenzen des Modells zu testen und die Sicherheit zu gewährleisten. Weiterhin stehe man auch mit politischen Entscheidungsträgern in Kontakt, um deren Bedenken in Bezug auf die Technologie zu diskutieren.

Bisher nicht öffentlich

"Wir geben unsere Forschungsfortschritte frühzeitig bekannt, um mit Menschen außerhalb von OpenAI zusammenzuarbeiten und von ihnen Feedback zu erhalten und um der Öffentlichkeit ein Gefühl dafür zu geben, welche KI-Fähigkeiten am Horizont zu erwarten sind", hieß es vonseiten des Anbieters.

Einer Reihe von bildenden Künstlern, Designern und Filmemachern wird allerdings bereits Zugang gewährt, um Rückmeldungen darüber zu erhalten, wie man das Modell so weiterentwickeln kann, dass es für Kreativschaffende am hilfreichsten ist. Es ist bislang nicht klar, wann OpenAI das neue Modell der Öffentlichkeit anbieten wird und was es den Endnutzern kosten würde.

Zusammenfassung
  • OpenAI stellt generatives KI-Modell Sora vor
  • Texteingaben werden zu bis zu einminütigen Videos
  • Sora mit "textbedingten Diffusionsmodellen" trainiert
  • Hyperrealistische Videos aus Textaufforderungen generierbar
  • Öffentliche Verfügbarkeit von Sora bis jetzt nicht gegeben
  • Red-Teamer testen Sora's Grenzen für Sicherheit
  • Kreative erhalten Zugang für Feedback zur Weiterentwicklung
  • Unklar, wann Sora öffentlich verfügbar sein wird

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!