Das erste Mal seit drei Jahren darf Sundar Pichai die Google I/O vor einem großen Live-Publikum eröffnen. Wie üblich fasst der Google-Chef dabei die wichtigsten Neuerungen für Dienste wie Suche, Maps und mehr zusammen. Die spannendsten Verbesserungen im Überblick.

Google lernt 24 neue Sprachen

Maps Immersive View

Auto-generierte Kapitel für Videos

Automatische Zusammenfassung in Docs

Google Assistent erkennt, wenn man ihn anschaut

Google ist bei der Verbesserung seines Übersetzungs-Dienstes Translate nicht mehr nur darauf angewiesen, Texte in beiden Sprachen zu analysieren. Künstliche Intelligenz macht es möglich, dem System auch Sprachen beizubringen, für die nur wenig Basismaterial vorliegt. Das Ergebnis: Google unterstützt jetzt 24 neue Sprachen, die von 300 Millionen Menschen gesprochen werden.Auch Google Maps profitiert von Fortschritten in KI, beispielsweise der Bilderkennung. Dabei nutzt das Unternehmen die Möglichkeit, immer mehr Gebäude aus Satellitenbildern zu erkennen und diese digital zu ergänzen. Global konnte man innerhalb eines Jahres die Darstellung von Gebäuden um 20 Prozent erhöhen. In Afrika stieg die Zahl der dargestellten Gebäude in dieser Zeit sogar um das Fünffache.All dieser Fortschritte sorgen dafür, dass Google die neue Funktion Immersive View für Maps ankündigen kann. Dabei handelt es sich um eine computergenerierte 3D-Ansicht, auf der I/O demonstriert man die Technik an einem ziemlich beeindruckenden Überflug von London. Die Technik lässt sich aber auch auf Innenräume anwenden: Google zeigt hier einen virtuellen Drohnenflug durch ein Restaurant - sehr spannend.In Europa wird man in diesem Jahr die Funktion integrieren, die umweltfreundlichste Route zu wählen - in den USA schon verfügbar.Auf YouTube wird die Anzahl der Videos, für die Google automatisch Kapitel erstellen kann, drastisch erhöht. Der Einsatz von "multimodaler Technologie von DeepMind" soll in diesem Jahr für eine Verzehnfachung sorgen. Daraus resultiert auch die Möglichkeit, Videotranskripte für alle iOS- und Android-Geräte deutlich ausweiten zu können."Kennen Sie das Gefühl der Panik, wenn Sie feststellen, dass Sie vor einer Sitzung ein 25-seitiges Dokument lesen müssen und es nicht gelesen haben?", so Sundar bei der I/O. Hier will Google in Zukunft mit einer automatisch generierten Zusammenfassung helfen.Google stellt abseits des Schlagworts einen neuen Weg vor, den Assistent zu aktivieren: Look and Talk, also in etwa Anschauen und Sprechen. Dabei wird der Dienst aktiviert, wenn das System das Gesicht des Nutzers erkennt. Dabei sollen "sechs Machine Learning-Modele" mehr als 100 Signale verbreiten, um zu erkennen, wann der Nutzer wirklich die Aufmerksamkeit des Assistent verlangt. Alle Daten werden dabei auf dem Gerät verarbeitet.Assistent soll außerdem endlich deutlich besser einen natürlichen Sprachfluss verstehen. Auf der Bühne stellt eine Entwicklerin dabei eine Frage, unterbrochen durch "mhhh" und mit unklarer Anweisungen einen Song zu spielen, ohne den genauen Namen zu nennen. Der Assistent meistert diese Aufgabe dank des Sprachmodells "LaMDA 2", "unsere bisher gesprächigste KI".