Google indiziert nun auch gescannte Bilder in PDFs

Internet & Webdienste Der Suchmaschinenbetreiber Google kann zukünftig noch umfassendere Inhalte in seinen Index aufnehmen, die als PDF-Dateien vorliegen. Dafür wurde eine OCR-Engine in den Spider integriert. Diese ermöglicht es, die elektronischen Dokumente über eine Schrifterkennung zu analysieren. Dies ist beispielsweise von Vorteil, wenn der Text in einem PDF von einem eingescannten Schriftstück stammt. Das Ergebnis kann anschließend ebenso indiziert werden, wie herkömmliche Textdokumente.

Die Technologie könnte zukünftig auch auf Bilddateien ausgedehnt werden. Allerdings wäre hierbei wohl eine Vorsortierung notwendig, um nicht unnütz Rechenleistung auf Fotos zu verschwenden, die keinerlei Text enthalten.
Diese Nachricht empfehlen
Kommentieren35
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!

Jetzt als Amazon Blitzangebot

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles

Tipp einsenden