ChatGPT-Macher zeigen erstmals ihre Text-zu-Video-KI "Sora"

Die ChatGPT-Betreiber von OpenAI haben jetzt ein neues System namens Sora vorgestellt. Dabei handelt es sich um ein generatives KI-Modell, dass Texteingaben in Videos umwandeln kann, die aktuell bis zu eine Minute lang sein können.

Christian Kahle, 16.02.2024 08:26 Uhr

Modell im Extrem-Test

Laut dem zugehörigen OpenAI-Forschungspapier wird das neue Sora-Modell mit "textbedingten Diffusionsmodellen auf Videos und Bildern mit variabler Dauer" trainiert, um hyperrealistische Videos aus textbasierten Aufforderungen zu erzeugen. Das Unternehmen merkte an, dass es beim KI-Training darauf Wert gelegt hat, "die physische Welt in Bewegung zu verstehen".

Sowohl in der Ankündigung als auch in der Forschungsarbeit wurden eine Reihe von Clips gezeigt, in denen das Modell vorgestellt wird. OpenAI-Chef Sam Altman nahm sogar Anfragen von Benutzern entgegen, um die Fähigkeiten des Modells zu zeigen.

Öffentlich verfügbar ist das Modell allerdings bis jetzt nicht. OpenAI wies darauf hin, dass man derzeit mit Red-Teamern zusammenarbeite, um die Grenzen des Modells zu testen und die Sicherheit zu gewährleisten. Weiterhin stehe man auch mit politischen Entscheidungsträgern in Kontakt, um deren Bedenken in Bezug auf die Technologie zu diskutieren.

Bisher nicht öffentlich

"Wir geben unsere Forschungsfortschritte frühzeitig bekannt, um mit Menschen außerhalb von OpenAI zusammenzuarbeiten und von ihnen Feedback zu erhalten und um der Öffentlichkeit ein Gefühl dafür zu geben, welche KI-Fähigkeiten am Horizont zu erwarten sind", hieß es vonseiten des Anbieters.

Einer Reihe von bildenden Künstlern, Designern und Filmemachern wird allerdings bereits Zugang gewährt, um Rückmeldungen darüber zu erhalten, wie man das Modell so weiterentwickeln kann, dass es für Kreativschaffende am hilfreichsten ist. Es ist bislang nicht klar, wann OpenAI das neue Modell der Öffentlichkeit anbieten wird und was es den Endnutzern kosten würde.

Zusammenfassung

OpenAI stellt generatives KI-Modell Sora vor
Texteingaben werden zu bis zu einminütigen Videos
Sora mit "textbedingten Diffusionsmodellen" trainiert
Hyperrealistische Videos aus Textaufforderungen generierbar
Öffentliche Verfügbarkeit von Sora bis jetzt nicht gegeben
Red-Teamer testen Sora's Grenzen für Sicherheit
Kreative erhalten Zugang für Feedback zur Weiterentwicklung
Unklar, wann Sora öffentlich verfügbar sein wird

Siehe auch:

Thema:

OpenAI

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren3

Hinweis einsenden

Weitere Nachrichten zum Thema Neue Art Cyberattacke: KI-Wurm infiziert ChatGPT und GeminiRelease-Termin für GPT-5 wird konkreter - erste Demos bei KundenHohe Kosten, wenig Nutzen? OpenAI will Video-KI Sora abschaltenBing Video Creator macht Sora für jedermann zugänglich - kostenfreiStable Video Diffusion: KI generiert Videos aus Fotos und BildernYouTube kennzeichnet künftig von KIs generierte Video-Inhalte