UNITE sieht ganz anders: Wie ein neues KI-System Deepfakes entlarvt
Videotools entwickeln sich in rasantem Tempo zu Werkzeugen, mit denen im Prinzip jeder täuschend echte Inhalte erstellen kann. Doch wie lassen sich immer präzisere Video-Ausgaben noch entlarven? Forscher haben jetzt eine neue Methode vorgestellt: UNITE.
Denn viele Fälschungen basieren längst nicht mehr auf Gesichtsmanipulationen, sondern auf vollständig künstlich erzeugten Szenen. Ein Forschungsteam aus Kalifornien schlägt nun einen anderen Weg ein: mit einem Detektor, der den gesamten Bildkontext analysiert - auch ohne sichtbare Personen.
Entwickelt wurde das System namens UNITE (Universal Network for Identifying Tampered and synthEtic Videos) von Rohit Kundu und Amit Roy-Chowdhury an der University of California in Riverside. Unterstützt von Google-Forschern zielt ihr Ansatz nicht mehr allein auf Gesichtserkennung, sondern analysiert ganze Videoframes - inklusive Hintergrund, Bewegungsmuster und Kontext. "Auf dem Weg zu einem universellen Detektor für synthetische Videos", so die Forscher in der Überschrift zu ihrer Arbeit.
Um das Modell auf unterschiedliche Arten von Manipulationen vorzubereiten, kombinierten die Forscher zwei Quellen: klassische Deepfake-Datensätze mit manipulierten Gesichtern (z. B. FaceForensics++) und synthetisches Videomaterial aus Computerspielen wie GTA V. Letzteres ist zwar leicht als künstlich erkennbar, enthält aber komplexe Bewegungsabläufe und Szenenwechsel - ideal, um dem System beizubringen, auch Bildfehler oder Manipulationen im Hintergrund zu erkennen.
Laut der auf arXiv veröffentlichten Studie (DOI: 10.48550/arxiv.2412.12278), übertraf UNITE bei Tests fast alle bisherigen Systeme - auch bei Videos ohne erkennbare Gesichter. Besonders deutlich zeigte sich der Vorteil des neuen Lernverfahrens bei Videos aus Generatoren wie Sora: Dort erkannte das System zuverlässig Fälschungen, wo andere Modelle versagten.
Mit zunehmender Verbreitung von Text-zu-Video-Systemen und KI-generierten Inhalten in sozialen Medien gewinnt das Thema an Brisanz. UNITE könnte künftig ein Werkzeug für Plattformen, Redaktionen und Faktenchecker sein - als universeller Detektor, der erkennt, was nicht echt ist, selbst wenn alles im Bild danach aussieht.
Längst gleicht die Entwicklung einem Katz-und-Maus-Spiel: Mit jedem Fortschritt bei generativen Modellen wachsen auch die Herausforderungen für die Erkennungssysteme. UNITE soll hier eine neue Grundlage schaffen - robuster, allgemeiner und weniger anfällig für Tricks im Detail.
Siehe auch:
UNITE: Der Deepfake-Jäger sieht mehr als nur Gesichter
Neue Videogeneratoren erstellen Inhalte, die zunehmend schwer von echten Aufnahmen zu unterscheiden sind - mit glaubwürdiger Bewegung, realistischer Tiefenschärfe und konsistentem Bildaufbau. Klassische Deepfake-Erkennungssysteme, die primär auf Gesichter trainiert sind, geraten dadurch ins Hintertreffen.Denn viele Fälschungen basieren längst nicht mehr auf Gesichtsmanipulationen, sondern auf vollständig künstlich erzeugten Szenen. Ein Forschungsteam aus Kalifornien schlägt nun einen anderen Weg ein: mit einem Detektor, der den gesamten Bildkontext analysiert - auch ohne sichtbare Personen.
Entwickelt wurde das System namens UNITE (Universal Network for Identifying Tampered and synthEtic Videos) von Rohit Kundu und Amit Roy-Chowdhury an der University of California in Riverside. Unterstützt von Google-Forschern zielt ihr Ansatz nicht mehr allein auf Gesichtserkennung, sondern analysiert ganze Videoframes - inklusive Hintergrund, Bewegungsmuster und Kontext. "Auf dem Weg zu einem universellen Detektor für synthetische Videos", so die Forscher in der Überschrift zu ihrer Arbeit.
Aufmerksamkeits-Trick
Der zentrale Clou von UNITE: Ein sogenannter Attention-Diversity-Loss. Vereinfacht gesagt zwingt diese Methode die KI dazu, bei der Analyse nicht nur auf die auffälligsten Stellen - meist Gesichter - zu achten. Stattdessen lernt das System, viele Bildbereiche gleichzeitig zu beobachten. Technisch geschieht das über ein Transformer-Netzwerk, das auf Bildmerkmale aus dem sogenannten "SigLIP"-Modell zurückgreift - einem vortrainierten KI-System, das aus Milliarden Bild-Text-Paaren gelernt hat, visuelle Muster unabhängig vom Motiv zu erkennen - eine Art universelles Bildverständnis.Um das Modell auf unterschiedliche Arten von Manipulationen vorzubereiten, kombinierten die Forscher zwei Quellen: klassische Deepfake-Datensätze mit manipulierten Gesichtern (z. B. FaceForensics++) und synthetisches Videomaterial aus Computerspielen wie GTA V. Letzteres ist zwar leicht als künstlich erkennbar, enthält aber komplexe Bewegungsabläufe und Szenenwechsel - ideal, um dem System beizubringen, auch Bildfehler oder Manipulationen im Hintergrund zu erkennen.
Laut der auf arXiv veröffentlichten Studie (DOI: 10.48550/arxiv.2412.12278), übertraf UNITE bei Tests fast alle bisherigen Systeme - auch bei Videos ohne erkennbare Gesichter. Besonders deutlich zeigte sich der Vorteil des neuen Lernverfahrens bei Videos aus Generatoren wie Sora: Dort erkannte das System zuverlässig Fälschungen, wo andere Modelle versagten.
Katz und Maus
Getestet wurde UNITE auch an realen Herausforderungen, etwa an einem Deepfake-Quiz der New York Times. Von zehn Videos identifizierte das System acht korrekt - inklusive aller vollständig KI-generierten Inhalte. Das zeigt, dass UNITE nicht nur auf bekannte und gelernte Manipulationstypen reagiert, sondern auch in neuen, bislang ungesehenen Kontexten eine gute Genauigkeit bietet.Mit zunehmender Verbreitung von Text-zu-Video-Systemen und KI-generierten Inhalten in sozialen Medien gewinnt das Thema an Brisanz. UNITE könnte künftig ein Werkzeug für Plattformen, Redaktionen und Faktenchecker sein - als universeller Detektor, der erkennt, was nicht echt ist, selbst wenn alles im Bild danach aussieht.
Längst gleicht die Entwicklung einem Katz-und-Maus-Spiel: Mit jedem Fortschritt bei generativen Modellen wachsen auch die Herausforderungen für die Erkennungssysteme. UNITE soll hier eine neue Grundlage schaffen - robuster, allgemeiner und weniger anfällig für Tricks im Detail.
Was sind Deepfakes überhaupt?
Deepfakes sind durch Künstliche Intelligenz erzeugte oder manipulierte Medieninhalte (Videos, Bilder, Audio), die täuschend echt wirken, aber gefälscht sind. Der Begriff setzt sich aus "Deep Learning" und "Fake" zusammen und bezeichnet sowohl die Technologie als auch die daraus resultierenden Fälschungen.
Diese KI-Manipulationen nutzen neuronale Netzwerke, um etwa Gesichter auszutauschen, Mimik zu verändern oder Stimmen zu imitieren. Die Technologie entwickelt sich rasant weiter, wodurch Deepfakes immer schwieriger von echten Aufnahmen zu unterscheiden sind.
Diese KI-Manipulationen nutzen neuronale Netzwerke, um etwa Gesichter auszutauschen, Mimik zu verändern oder Stimmen zu imitieren. Die Technologie entwickelt sich rasant weiter, wodurch Deepfakes immer schwieriger von echten Aufnahmen zu unterscheiden sind.
Wie funktioniert die Technologie?
Die Deepfake-Technologie basiert auf künstlichen neuronalen Netzen und speziell auf Deep Learning. Dabei werden sogenannte Generative Adversarial Networks (GANs) eingesetzt, bei denen zwei KI-Systeme gegeneinander arbeiten: Ein Generator erstellt Fälschungen, während ein Diskriminator versucht, diese zu erkennen.
Für einen überzeugenden Deepfake benötigt die KI umfangreiches Bildmaterial der zu imitierenden Person, um deren Mimik, Bewegungen und Besonderheiten zu analysieren. Je mehr Trainingsmaterial vorhanden ist, desto realistischer wird das Ergebnis, weshalb öffentliche Personen besonders betroffen sind.
Für einen überzeugenden Deepfake benötigt die KI umfangreiches Bildmaterial der zu imitierenden Person, um deren Mimik, Bewegungen und Besonderheiten zu analysieren. Je mehr Trainingsmaterial vorhanden ist, desto realistischer wird das Ergebnis, weshalb öffentliche Personen besonders betroffen sind.
Wie erkenne ich Deepfakes?
Trotz zunehmender Qualität gibt es Hinweise auf Deepfakes: Achten Sie auf unnatürliche Gesichtszüge, seltsame Mimik oder unlogische Schatten. Unscharfe Übergänge zwischen Gesicht und Hals oder Haaren können verdächtig sein, ebenso wie fehlendes oder unnatürliches Blinzeln.
Unterschiedliche Bildqualitäten innerhalb eines Videos oder unpassende Beleuchtung sind weitere Anzeichen. Bei bekannten Personen kann ein Vergleich mit früheren Aufnahmen helfen. Es gibt auch spezialisierte KI-Tools wie Reality Defender, die bei der Erkennung unterstützen können.
Unterschiedliche Bildqualitäten innerhalb eines Videos oder unpassende Beleuchtung sind weitere Anzeichen. Bei bekannten Personen kann ein Vergleich mit früheren Aufnahmen helfen. Es gibt auch spezialisierte KI-Tools wie Reality Defender, die bei der Erkennung unterstützen können.
Welche Gefahren bergen Deepfakes?
Deepfakes können für Betrug und Manipulation missbraucht werden, etwa beim "CEO-Fraud", wo Angreifer mit gefälschten Stimmen Geldüberweisungen auslösen. Sie dienen auch zur Verbreitung von Falschinformationen und können politische Meinungsbildung beeinflussen.
Besonders problematisch ist die Erstellung von gefälschten pornografischen Inhalten mit den Gesichtern prominenter oder privater Personen. Zudem könnten Deepfakes genutzt werden, um biometrische Sicherheitssysteme zu überwinden oder unschuldige Personen fälschlicherweise zu beschuldigen.
Besonders problematisch ist die Erstellung von gefälschten pornografischen Inhalten mit den Gesichtern prominenter oder privater Personen. Zudem könnten Deepfakes genutzt werden, um biometrische Sicherheitssysteme zu überwinden oder unschuldige Personen fälschlicherweise zu beschuldigen.
Gibt es Schutz vor Deepfakes?
Zur Prävention gehört vor allem Aufklärung und Medienkompetenz. Unternehmen sollten Mitarbeitende schulen und robuste Sicherheitsprotokolle implementieren, etwa mehrfache Verifizierungen bei ungewöhnlichen Anfragen oder Geldtransfers.
Technologisch helfen KI-basierte Erkennungssoftware und digitale Wasserzeichen. Experten arbeiten an verlässlicheren Methoden wie Blockchain-basierter Authentifizierung von Medieninhalten. Gesetzliche Regelungen, wie sie die EU-Kommission fordert, könnten zudem verlangen, dass KI-generierte Inhalte gekennzeichnet werden müssen.
Technologisch helfen KI-basierte Erkennungssoftware und digitale Wasserzeichen. Experten arbeiten an verlässlicheren Methoden wie Blockchain-basierter Authentifizierung von Medieninhalten. Gesetzliche Regelungen, wie sie die EU-Kommission fordert, könnten zudem verlangen, dass KI-generierte Inhalte gekennzeichnet werden müssen.
Wer nutzt Deepfakes wozu?
In der Filmindustrie werden Deepfake-ähnliche Technologien genutzt, um verstorbene Schauspieler digital wiederauferstehen zu lassen oder für Spezialeffekte. Künstler experimentieren mit der Technologie für kreative Zwecke und neue visuelle Ausdrucksformen.
Andererseits werden Deepfakes für Cybermobbing, Betrug, Desinformationskampagnen und politische Propaganda eingesetzt. Besonders problematisch ist die Verbreitung von manipulierten Inhalten in sozialen Medien, wo sie schnell große Reichweite erzielen und erheblichen Schaden anrichten können.
Andererseits werden Deepfakes für Cybermobbing, Betrug, Desinformationskampagnen und politische Propaganda eingesetzt. Besonders problematisch ist die Verbreitung von manipulierten Inhalten in sozialen Medien, wo sie schnell große Reichweite erzielen und erheblichen Schaden anrichten können.
Seit wann gibt es Deepfakes?
Der Begriff "Deepfake" entstand 2017, als ein anonymer Reddit-Nutzer unter diesem Pseudonym manipulierte Pornovideos mit den Gesichtern bekannter Schauspielerinnen veröffentlichte. Die grundlegende Technologie wurde jedoch bereits 2014 entwickelt, als der Forscher Ian Goodfellow die GANs vorstellte.
Seitdem hat sich die Technologie rasant weiterentwickelt, sodass die Erstellung von Deepfakes immer einfacher und die Ergebnisse immer überzeugender werden. Laut Experten hat sich die Anzahl der Deepfakes seit 2018 alle sechs Monate verdoppelt.
Seitdem hat sich die Technologie rasant weiterentwickelt, sodass die Erstellung von Deepfakes immer einfacher und die Ergebnisse immer überzeugender werden. Laut Experten hat sich die Anzahl der Deepfakes seit 2018 alle sechs Monate verdoppelt.
Was sagt das Gesetz zu Deepfakes?
Die rechtliche Situation zu Deepfakes entwickelt sich noch. In der EU gibt es Bestrebungen, dass alle mit Deepfake-Technologie erstellten Materialien als solche gekennzeichnet werden müssen, wie im KI-Regulierungsentwurf der EU-Kommission vorgesehen.
Bei missbräuchlicher Verwendung können je nach Kontext verschiedene Straftatbestände wie Betrug, Verleumdung oder Verletzung von Persönlichkeitsrechten greifen. Rechtliche Herausforderungen entstehen auch bei der Beweisführung vor Gericht, wenn die Echtheit von Bild- oder Videomaterial angezweifelt wird.
Bei missbräuchlicher Verwendung können je nach Kontext verschiedene Straftatbestände wie Betrug, Verleumdung oder Verletzung von Persönlichkeitsrechten greifen. Rechtliche Herausforderungen entstehen auch bei der Beweisführung vor Gericht, wenn die Echtheit von Bild- oder Videomaterial angezweifelt wird.
Zusammenfassung
- UNITE analysiert den gesamten Bildkontext statt nur Gesichter bei Deepfakes
- Entwickelt von kalifornischen Forschern mit Unterstützung von Google
- Das System nutzt Attention-Diversity-Loss für umfassende Bildbereichsanalyse
- Training mit klassischen Deepfakes und synthetischem Material aus Computerspielen
- Übertrifft bisherige Systeme besonders bei Videos ohne erkennbare Gesichter
- Erfolgreiche Tests mit neuen KI-Generatoren wie Sora und einem NYT-Deepfake-Quiz
- Könnte wichtiges Werkzeug für Plattformen, Redaktionen und Faktenchecker werden
Siehe auch:
- Copyright aufs Ich: Dänemark plant revolutionäres Deepfake-Gesetz
- Mit Haut und Herzschlag: Deepfakes machen erschreckende Fortschritte
- Phishing per Video: YouTube warnt vor Deepfakes des Chefs
- Deepfake diskreditiert Tim Walz - Russen jetzt voll im US-Wahlkampf
- Lange Haftstrafen: Bayern will gegen Deepfakes bald hart durchgreifen
Thema:
Videos zum Thema KI
- KI hält in Kameras Einzug: Was sie dort tut und was es bringt
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Super Bowl 2026: Claude verrät, wie man einen Sixpack bekommt
- Super Bowl 2026: Oakley Meta-Brillen halten epische Sportmomente fest
- Super Bowl 2026: Base44 zeigt, wie KI jeden zum Programmierer macht
Beiträge aus dem Forum
Interessante Links
Neue Nachrichten
- Nur für 3 Stunden: Riesiger 85" Mini-LED-TV bei Media Markt im Angebot
- Zero Trust: Windows Server startet verschlüsselte Namensauflösung
- Nvidia GPU RTX Pro 6000: Preis steigt um krasse 55 Prozent
- Google Earth: Flugsimulator jetzt kostenlos im Browser nutzbar
- iPhone Fold Ultra im Hands-on-Video: Alle Details im Überblick
- Tesla-Autopilot: Fahrer hebeln Sicherheitssystem mit 8-€-Gadget aus
- Spiele bis zu 95 % schneller laden: Riesiger Boost für AMD-GPUs ist da
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen