Google: Neue Methode lässt Computer besser sehen

Auge, Mensch, Iris Bildquelle: Laitr Keiows (CC BY-SA 3.0)
Die Forscher des Suchmaschinenkonzerns Google haben verbesserte Methoden des maschinellen "Sehens" entwickelt, die in kurzer Zeit eine sehr hohe Zahl von Objekten auf einem Bild auseinanderhalten kann.
Entsprechende Technologien machten in den letzten Jahren spürbare Fortschritte - wie sich beispielsweise an den bereits sehr genau arbeitenden Bewegungssteuerungen für Spielekonsolen erkennen lässt. Hinsichtlich der Details ist man bei Google nun noch einen deutlichen Schritt weiter gekommen, wenn der entsprechende Algorithmus auch mit einzelnen Fotos und nicht in Echtzeit mit Videos arbeitet.

Wie die Entwickler mitteilten, kann ihre Technik binnen weniger Minuten rund 100.000 verschiedene Objekte auf einem Bild identifizieren. Dabei verfolgte man gegenüber vergleichbaren Technologien einen neuen Ansatz, um die erkannten Strukturen letztlich einem Muster zuzuordnen.

Bisher setzte man bei solchen Analyse-Systemen darauf, ein Bild mit verschiedenen Filtern nach bestimmten Formen zu durchsuchen. So wurde in einem Durchlauf etwa versucht, herauszufinden, ob ein Hund zu sehen ist, im nächsten Schritt kam dann beispielsweise ein Katzen-Filter zum Einsatz. Das ist aber nicht besonders effizient, wenn sehr viele Objekte erkannt werden sollen, da für jeden Typ ein neuer Durchlauf mit einem neuen Filter gemacht werden muss.

Die Forscher bei Google setzten daher auf ein etwas verändertes Verfahren. Sie sorgten erst einmal dafür, dass die einzelnen Objekte grundsätzlich auseinandergehalten werden. Anschließend wurde für jedes von ihnen ein Vergleichswert ermittelt - im groben lässt sich dies mit der Erstellung eines Hashes umschreiben. Diese Werte können dann mit schnellen Sortier-Verfahren mit einer Tabelle verglichen werden, in der im Vorfeld mit den bereits bekannten Filtermethoden verschiedene Muster eingetragen wurden.

Die Geschwindigkeit der Bildanalyse soll sich so gegenüber den herkömmlichen Verfahren um eine Faktor von rund 20.000 beschleunigen. Die Auswertung eines Fotos, auf dem tausende verschiedene Objekte unterschieden werden, in einer Zeit von gerade einmal 20 Sekunden führten die Entwickler dabei nicht auf einem Supercomputer durch, sondern auf einer einzelnen Workstation mit einem Multicore-Prozessor und 20 Gigabyte Arbeitsspeicher. Das Verfahren ist somit wohl effizient genug, auch bei der Bilderkennung in Smartphones deutliche Verbesserungen zu bringen und beispielsweise Augmented Reality-Anwendungen deutlich zu optimieren. Auge, Mensch, Iris Auge, Mensch, Iris Laitr Keiows (CC BY-SA 3.0)
Diese Nachricht empfehlen
Kommentieren8
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!

Jetzt als Amazon Blitzangebot

Ab 00:00 Uhr F-Secure Internet Security - 1 Jahr / 1 Computer
F-Secure Internet Security - 1 Jahr / 1 Computer
Original Amazon-Preis
22,99
Im Preisvergleich ab
22,99
Blitzangebot-Preis
18,48
Ersparnis zu Amazon 20% oder 4,51

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Tipp einsenden