UNITE sieht ganz anders: Wie ein neues KI-System Deepfakes entlarvt

Videotools entwickeln sich in rasantem Tempo zu Werkzeugen, mit denen im Prinzip jeder täuschend echte Inhalte erstellen kann. Doch wie lassen sich immer präzisere Video-Ausgaben noch entlarven? Forscher haben jetzt eine neue Methode vorgestellt: UNITE.

John Woll, 25.07.2025 12:57 Uhr

Fälschung, Manipulation, Deepfake, Gesicht, Deep Fake, Blutgefäße

WinFuture / Ki-generiert

UNITE: Der Deepfake-Jäger sieht mehr als nur Gesichter

Neue Videogeneratoren erstellen Inhalte, die zunehmend schwer von echten Aufnahmen zu unterscheiden sind - mit glaubwürdiger Bewegung, realistischer Tiefenschärfe und konsistentem Bildaufbau. Klassische Deepfake-Erkennungssysteme, die primär auf Gesichter trainiert sind, geraten dadurch ins Hintertreffen.

Denn viele Fälschungen basieren längst nicht mehr auf Gesichtsmanipulationen, sondern auf vollständig künstlich erzeugten Szenen. Ein Forschungsteam aus Kalifornien schlägt nun einen anderen Weg ein: mit einem Detektor, der den gesamten Bildkontext analysiert - auch ohne sichtbare Personen.

Entwickelt wurde das System namens UNITE (Universal Network for Identifying Tampered and synthEtic Videos) von Rohit Kundu und Amit Roy-Chowdhury an der University of California in Riverside. Unterstützt von Google-Forschern zielt ihr Ansatz nicht mehr allein auf Gesichtserkennung, sondern analysiert ganze Videoframes - inklusive Hintergrund, Bewegungsmuster und Kontext. "Auf dem Weg zu einem universellen Detektor für synthetische Videos", so die Forscher in der Überschrift zu ihrer Arbeit.

Aufmerksamkeits-Trick

Der zentrale Clou von UNITE: Ein sogenannter Attention-Diversity-Loss. Vereinfacht gesagt zwingt diese Methode die KI dazu, bei der Analyse nicht nur auf die auffälligsten Stellen - meist Gesichter - zu achten. Stattdessen lernt das System, viele Bildbereiche gleichzeitig zu beobachten. Technisch geschieht das über ein Transformer-Netzwerk, das auf Bildmerkmale aus dem sogenannten "SigLIP"-Modell zurückgreift - einem vortrainierten KI-System, das aus Milliarden Bild-Text-Paaren gelernt hat, visuelle Muster unabhängig vom Motiv zu erkennen - eine Art universelles Bildverständnis.

Um das Modell auf unterschiedliche Arten von Manipulationen vorzubereiten, kombinierten die Forscher zwei Quellen: klassische Deepfake-Datensätze mit manipulierten Gesichtern (z. B. FaceForensics++) und synthetisches Videomaterial aus Computerspielen wie GTA V. Letzteres ist zwar leicht als künstlich erkennbar, enthält aber komplexe Bewegungsabläufe und Szenenwechsel - ideal, um dem System beizubringen, auch Bildfehler oder Manipulationen im Hintergrund zu erkennen.

Laut der auf arXiv veröffentlichten Studie (DOI: 10.48550/arxiv.2412.12278), übertraf UNITE bei Tests fast alle bisherigen Systeme - auch bei Videos ohne erkennbare Gesichter. Besonders deutlich zeigte sich der Vorteil des neuen Lernverfahrens bei Videos aus Generatoren wie Sora: Dort erkannte das System zuverlässig Fälschungen, wo andere Modelle versagten.

Katz und Maus

Getestet wurde UNITE auch an realen Herausforderungen, etwa an einem Deepfake-Quiz der New York Times. Von zehn Videos identifizierte das System acht korrekt - inklusive aller vollständig KI-generierten Inhalte. Das zeigt, dass UNITE nicht nur auf bekannte und gelernte Manipulationstypen reagiert, sondern auch in neuen, bislang ungesehenen Kontexten eine gute Genauigkeit bietet.

Mit zunehmender Verbreitung von Text-zu-Video-Systemen und KI-generierten Inhalten in sozialen Medien gewinnt das Thema an Brisanz. UNITE könnte künftig ein Werkzeug für Plattformen, Redaktionen und Faktenchecker sein - als universeller Detektor, der erkennt, was nicht echt ist, selbst wenn alles im Bild danach aussieht.

Längst gleicht die Entwicklung einem Katz-und-Maus-Spiel: Mit jedem Fortschritt bei generativen Modellen wachsen auch die Herausforderungen für die Erkennungssysteme. UNITE soll hier eine neue Grundlage schaffen - robuster, allgemeiner und weniger anfällig für Tricks im Detail.

Was sind Deepfakes überhaupt?

Deepfakes sind durch Künstliche Intelligenz erzeugte oder manipulierte Medieninhalte (Videos, Bilder, Audio), die täuschend echt wirken, aber gefälscht sind. Der Begriff setzt sich aus "Deep Learning" und "Fake" zusammen und bezeichnet sowohl die Technologie als auch die daraus resultierenden Fälschungen.

Diese KI-Manipulationen nutzen neuronale Netzwerke, um etwa Gesichter auszutauschen, Mimik zu verändern oder Stimmen zu imitieren. Die Technologie entwickelt sich rasant weiter, wodurch Deepfakes immer schwieriger von echten Aufnahmen zu unterscheiden sind.

Wie funktioniert die Technologie?

Die Deepfake-Technologie basiert auf künstlichen neuronalen Netzen und speziell auf Deep Learning. Dabei werden sogenannte Generative Adversarial Networks (GANs) eingesetzt, bei denen zwei KI-Systeme gegeneinander arbeiten: Ein Generator erstellt Fälschungen, während ein Diskriminator versucht, diese zu erkennen.

Für einen überzeugenden Deepfake benötigt die KI umfangreiches Bildmaterial der zu imitierenden Person, um deren Mimik, Bewegungen und Besonderheiten zu analysieren. Je mehr Trainingsmaterial vorhanden ist, desto realistischer wird das Ergebnis, weshalb öffentliche Personen besonders betroffen sind.

Wie erkenne ich Deepfakes?

Trotz zunehmender Qualität gibt es Hinweise auf Deepfakes: Achten Sie auf unnatürliche Gesichtszüge, seltsame Mimik oder unlogische Schatten. Unscharfe Übergänge zwischen Gesicht und Hals oder Haaren können verdächtig sein, ebenso wie fehlendes oder unnatürliches Blinzeln.

Unterschiedliche Bildqualitäten innerhalb eines Videos oder unpassende Beleuchtung sind weitere Anzeichen. Bei bekannten Personen kann ein Vergleich mit früheren Aufnahmen helfen. Es gibt auch spezialisierte KI-Tools wie Reality Defender, die bei der Erkennung unterstützen können.

Welche Gefahren bergen Deepfakes?

Deepfakes können für Betrug und Manipulation missbraucht werden, etwa beim "CEO-Fraud", wo Angreifer mit gefälschten Stimmen Geldüberweisungen auslösen. Sie dienen auch zur Verbreitung von Falschinformationen und können politische Meinungsbildung beeinflussen.

Besonders problematisch ist die Erstellung von gefälschten pornografischen Inhalten mit den Gesichtern prominenter oder privater Personen. Zudem könnten Deepfakes genutzt werden, um biometrische Sicherheitssysteme zu überwinden oder unschuldige Personen fälschlicherweise zu beschuldigen.

Gibt es Schutz vor Deepfakes?

Zur Prävention gehört vor allem Aufklärung und Medienkompetenz. Unternehmen sollten Mitarbeitende schulen und robuste Sicherheitsprotokolle implementieren, etwa mehrfache Verifizierungen bei ungewöhnlichen Anfragen oder Geldtransfers.

Technologisch helfen KI-basierte Erkennungssoftware und digitale Wasserzeichen. Experten arbeiten an verlässlicheren Methoden wie Blockchain-basierter Authentifizierung von Medieninhalten. Gesetzliche Regelungen, wie sie die EU-Kommission fordert, könnten zudem verlangen, dass KI-generierte Inhalte gekennzeichnet werden müssen.

Wer nutzt Deepfakes wozu?

In der Filmindustrie werden Deepfake-ähnliche Technologien genutzt, um verstorbene Schauspieler digital wiederauferstehen zu lassen oder für Spezialeffekte. Künstler experimentieren mit der Technologie für kreative Zwecke und neue visuelle Ausdrucksformen.

Andererseits werden Deepfakes für Cybermobbing, Betrug, Desinformationskampagnen und politische Propaganda eingesetzt. Besonders problematisch ist die Verbreitung von manipulierten Inhalten in sozialen Medien, wo sie schnell große Reichweite erzielen und erheblichen Schaden anrichten können.

Seit wann gibt es Deepfakes?

Der Begriff "Deepfake" entstand 2017, als ein anonymer Reddit-Nutzer unter diesem Pseudonym manipulierte Pornovideos mit den Gesichtern bekannter Schauspielerinnen veröffentlichte. Die grundlegende Technologie wurde jedoch bereits 2014 entwickelt, als der Forscher Ian Goodfellow die GANs vorstellte.

Seitdem hat sich die Technologie rasant weiterentwickelt, sodass die Erstellung von Deepfakes immer einfacher und die Ergebnisse immer überzeugender werden. Laut Experten hat sich die Anzahl der Deepfakes seit 2018 alle sechs Monate verdoppelt.

Was sagt das Gesetz zu Deepfakes?

Die rechtliche Situation zu Deepfakes entwickelt sich noch. In der EU gibt es Bestrebungen, dass alle mit Deepfake-Technologie erstellten Materialien als solche gekennzeichnet werden müssen, wie im KI-Regulierungsentwurf der EU-Kommission vorgesehen.

Bei missbräuchlicher Verwendung können je nach Kontext verschiedene Straftatbestände wie Betrug, Verleumdung oder Verletzung von Persönlichkeitsrechten greifen. Rechtliche Herausforderungen entstehen auch bei der Beweisführung vor Gericht, wenn die Echtheit von Bild- oder Videomaterial angezweifelt wird.

Zusammenfassung

UNITE analysiert den gesamten Bildkontext statt nur Gesichter bei Deepfakes
Entwickelt von kalifornischen Forschern mit Unterstützung von Google
Das System nutzt Attention-Diversity-Loss für umfassende Bildbereichsanalyse
Training mit klassischen Deepfakes und synthetischem Material aus Computerspielen
Übertrifft bisherige Systeme besonders bei Videos ohne erkennbare Gesichter
Erfolgreiche Tests mit neuen KI-Generatoren wie Sora und einem NYT-Deepfake-Quiz
Könnte wichtiges Werkzeug für Plattformen, Redaktionen und Faktenchecker werden

Siehe auch:

Thema:

Künstliche Intelligenz

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren1

Hinweis einsenden

Weitere Nachrichten zum Thema Shitstorm gegen Mode-Zeitschrift Vogue wegen eines KI-ModelsBetrug auf Airbnb: Host fälschte Schäden auf Beweisbildern wohl mit KIKampf um die Wahrheit entbrennt an Deepfakes von Einstein & Co.Copyright aufs Ich: Dänemark plant revolutionäres Deepfake-GesetzMit Haut und Herzschlag: Deepfakes machen erschreckende FortschrittePhishing per Video: YouTube warnt vor Deepfakes des Chefs