Google indiziert nun auch gescannte Bilder in PDFs

Internet & Webdienste Der Suchmaschinenbetreiber Google kann zukünftig noch umfassendere Inhalte in seinen Index aufnehmen, die als PDF-Dateien vorliegen. Dafür wurde eine OCR-Engine in den Spider integriert. Diese ermöglicht es, die elektronischen Dokumente über eine Schrifterkennung zu analysieren. Dies ist beispielsweise von Vorteil, wenn der Text in einem PDF von einem eingescannten Schriftstück stammt. Das Ergebnis kann anschließend ebenso indiziert werden, wie herkömmliche Textdokumente.

Die Technologie könnte zukünftig auch auf Bilddateien ausgedehnt werden. Allerdings wäre hierbei wohl eine Vorsortierung notwendig, um nicht unnütz Rechenleistung auf Fotos zu verschwenden, die keinerlei Text enthalten.
Diese Nachricht empfehlen
Kommentieren35
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!
Einloggen

Jetzt als Amazon Blitzangebot

Ab 10:00 Uhr Samsung C27F398F 68,58 cm (27 Zoll) Curved Monitor (HDMI, D-Sub, 4ms Reaktionszeit, 60 Hz Wiederholungsfrequenz, 1920 x 1080 Pixel)
Samsung C27F398F 68,58 cm (27 Zoll) Curved Monitor (HDMI, D-Sub, 4ms Reaktionszeit, 60 Hz Wiederholungsfrequenz, 1920 x 1080 Pixel)
Original Amazon-Preis
235,00
Im Preisvergleich ab
228,85
Blitzangebot-Preis
199,00
Ersparnis zu Amazon 15% oder 36

Acrobat Standard 2015 im Preisvergleich

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles

Tipp einsenden