Microsoft erschafft Video-Tool, aus dem die Deepfake-Albträume sind
Es gibt schon lange Bedenken, dass echte Videos von Deepfakes bald nicht mehr unterscheidbar sind, bisher erwiesen sich diese jedoch als unbegründet. Denn solche KI-Videos waren immer noch tendenziell hölzern. Doch Microsoft zeigt, dass sich das bald ändern könnte.
"VASA-1 ist nicht nur in der Lage, Lippenbewegungen zu erzeugen, die hervorragend mit dem Ton synchronisiert sind, sondern auch ein großes Spektrum an Gesichtsnuancen und natürlichen Kopfbewegungen zu erfassen, die zur Wahrnehmung von Authentizität und Lebendigkeit beitragen", erklärt Microsoft in einem Blogbeitrag. "Zu den Kerninnovationen gehören ein ganzheitliches Modell zur Erzeugung von Gesichtsdynamik und Kopfbewegungen, das in einem latenten Gesichtsraum arbeitet, und die Entwicklung eines solchen ausdrucksstarken und entwirrten latenten Gesichtsraums anhand von Videos."
Anders gesagt: VASA-1 passt nicht nur die Lippenbewegungen an, sondern sorgt auch durch simulierte Emotionen für Tiefe und entsprechende Glaubwürdigkeit. Bei diesem Modell besteht auch Kontrolle über bestimmte Aspekte, Nutzer können Blickrichtung der Figur, die wahrgenommene Entfernung und sogar den emotionalen Zustand vorgeben.
Microsoft betont dabei, dass es sich hier ausschließlich um ein Forschungsprojekt handelt: "Wir erforschen visuelle, affektive Fähigkeiten für virtuelle, interaktive Charaktere, die NICHT eine Person in der realen Welt verkörpern. Dies ist nur eine Forschungsdemonstration und es gibt keinen Plan für die Veröffentlichung eines Produkts oder einer API."
Ein Foto und ein Audio-Clip genügen
Ein einziges Foto und ein Audio-Clip reichen, um ein Video zu erstellen, das erstaunliche und erschreckend realistische Ergebnisse liefert. Das jedenfalls ist das Ergebnis von VASA-1, einem Modell, das von Microsoft geschaffen wurde und eben erstaunlich gute Videos zum Resultat hat."VASA-1 ist nicht nur in der Lage, Lippenbewegungen zu erzeugen, die hervorragend mit dem Ton synchronisiert sind, sondern auch ein großes Spektrum an Gesichtsnuancen und natürlichen Kopfbewegungen zu erfassen, die zur Wahrnehmung von Authentizität und Lebendigkeit beitragen", erklärt Microsoft in einem Blogbeitrag. "Zu den Kerninnovationen gehören ein ganzheitliches Modell zur Erzeugung von Gesichtsdynamik und Kopfbewegungen, das in einem latenten Gesichtsraum arbeitet, und die Entwicklung eines solchen ausdrucksstarken und entwirrten latenten Gesichtsraums anhand von Videos."
VASA-1: Gleicher Bewegungsablauf mit unterschiedlichen Fotos
Anders gesagt: VASA-1 passt nicht nur die Lippenbewegungen an, sondern sorgt auch durch simulierte Emotionen für Tiefe und entsprechende Glaubwürdigkeit. Bei diesem Modell besteht auch Kontrolle über bestimmte Aspekte, Nutzer können Blickrichtung der Figur, die wahrgenommene Entfernung und sogar den emotionalen Zustand vorgeben.
VASA-1 ist (vorerst?) nur Forschung
Auf der Seite des Forschungsprojekts kann man zahlreiche Beispielvideos dazu finden, diese arbeiten allerdings ausschließlich mit virtuellen und nicht echten Personen - was eine Beurteilung erschwert, wie gut das mit echten Menschen funktionieren würde.Echtzeit-Demonstration, wie derartige Videos erschaffen werden
Microsoft betont dabei, dass es sich hier ausschließlich um ein Forschungsprojekt handelt: "Wir erforschen visuelle, affektive Fähigkeiten für virtuelle, interaktive Charaktere, die NICHT eine Person in der realen Welt verkörpern. Dies ist nur eine Forschungsdemonstration und es gibt keinen Plan für die Veröffentlichung eines Produkts oder einer API."
Thema:
Videos zum Thema KI
- KI hält in Kameras Einzug: Was sie dort tut und was es bringt
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Super Bowl 2026: Claude verrät, wie man einen Sixpack bekommt
- Super Bowl 2026: Oakley Meta-Brillen halten epische Sportmomente fest
- Super Bowl 2026: Base44 zeigt, wie KI jeden zum Programmierer macht
Beiträge aus dem Forum
Interessante Links
Neue Nachrichten
- Nur für 3 Stunden: Riesiger 85" Mini-LED-TV bei Media Markt im Angebot
- Zero Trust: Windows Server startet verschlüsselte Namensauflösung
- Nvidia GPU RTX Pro 6000: Preis steigt um krasse 55 Prozent
- Google Earth: Flugsimulator jetzt kostenlos im Browser nutzbar
- iPhone Fold Ultra im Hands-on-Video: Alle Details im Überblick
- Tesla-Autopilot: Fahrer hebeln Sicherheitssystem mit 8-€-Gadget aus
- Spiele bis zu 95 % schneller laden: Riesiger Boost für AMD-GPUs ist da
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen