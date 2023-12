Google hat mit Gemini ein angeblich extrem leistungsstarkes Sprach­modell vorgestellt, das in Konkurrenz mit GPT-4 & Co treten soll. Dabei zeigte man ein beeindruckendes Video , das angeblich die Inter­aktion mit der KI zeigte. Jetzt ist klar: große Teile des Videos sind nicht echt.

Kein Gespräch, keine Interaktion in Echtzeit

Wie Google gegenüber dem US-Wirtschaftsdienst Bloomberg inzwischen klargestellt hat, fand die in dem Video mit dem Titel " Hands-on with Gemini: Interacting with multimodal AI " gezeigte Interaktion mit der KI nie in der gezeigten Form statt. In der Videobeschreibung des Videos war lediglich davon die Rede, dass man die Abläufe beschleunigt dargestellt habe.Tatsächlich war aber deutlich mehr "Manipulation" nötig, um die von Google gezeigte, simple, schnelle und unterhaltsame Interaktion mit Gemini in dem Video "darzustellen". Die von Google gezeigte stimmliche Kommunikation zwischen dem angeblichen User und Gemini fand dabei nie statt. Stattdessen sei die eigentliche Demo unter Verwendung von Standbildern aus den Videoaufnahmen in Verbindung mit textbasierten Eingaben der Anfragen an die KI durchgeführt worden.Im Grunde funktionierte das Ganze also bei Weitem nicht auf die in dem Video suggerierte, beeindruckende Weise. So ließ das Video vermuten, Gemini könne per Sprachausgabe schnell und interaktiv mit dem Nutzer "zusammenarbeiten" und dabei zum Beispiel vorhersagen, was der Nutzer gerade zeichnet, während das Bild noch in der Entstehung ist. Auch die in Echtzeit erfolgenden Reaktionen der KI gab es nie.Google erklärte als Reaktion auf die Vorwürfe wegen der möglichen Täuschung der Öffentlichkeit mit seinem Demo-Video laut The Verge , dass sämtliche Nutzeranfragen und die in dem Video gezeigten Ausgaben der KI "echt und gekürzt" seien. Man wolle mit dem Video zeigen, wie ein "multimodales Nutzungserlebnis unter Verwendung von Gemini aussehen könnte", so Oriol Vinyals, Vice President of Research and Deep Learning bei Googles KI-Sparte DeepMind und Co-Lead für Gemini, in einem Post bei X/Twitter Man habe damit lediglich eine Inspiration für andere Entwickler bieten wollen, hieß es weiter. Das Team habe Gemini mit Bildern und Texten gefüttert und die KI dann aufgefordert, auf dieser Basis Vorhersagen zu treffen, was als nächstes passieren würde. Die so erzielten Ergebnisse wurden dann offensichtlich zu dem oben eingebundenen Werbevideo aufbereitet - denn mehr als ein gestelltes Marketing-Video ist dieses dann wohl auch nicht.