Google indiziert nun auch gescannte Bilder in PDFs

Internet & Webdienste Der Suchmaschinenbetreiber Google kann zukünftig noch umfassendere Inhalte in seinen Index aufnehmen, die als PDF-Dateien vorliegen. Dafür wurde eine OCR-Engine in den Spider integriert. Diese ermöglicht es, die elektronischen Dokumente über eine Schrifterkennung zu analysieren. Dies ist beispielsweise von Vorteil, wenn der Text in einem PDF von einem eingescannten Schriftstück stammt. Das Ergebnis kann anschließend ebenso indiziert werden, wie herkömmliche Textdokumente.

Die Technologie könnte zukünftig auch auf Bilddateien ausgedehnt werden. Allerdings wäre hierbei wohl eine Vorsortierung notwendig, um nicht unnütz Rechenleistung auf Fotos zu verschwenden, die keinerlei Text enthalten.
Diese Nachricht empfehlen
Kommentieren35
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!
Einloggen

Videos zum Thema PDF

Jetzt als Amazon Blitzangebot

Ab 17:40 Uhr Bluetooth Kopfhörer Kabellos In Ear Ohrhörer True Wireless Bluetooth 5.0 Earbuds Noise Cancelling Kopfhörer mit 2600mAh Batterie 150 Stunden Spielzeit mit IPX7 Wasserdicht Integriertes MikrofonBluetooth Kopfhörer Kabellos In Ear Ohrhörer True Wireless Bluetooth 5.0 Earbuds Noise Cancelling Kopfhörer mit 2600mAh Batterie 150 Stunden Spielzeit mit IPX7 Wasserdicht Integriertes Mikrofon
Original Amazon-Preis
39,99
Im Preisvergleich ab
?
Blitzangebot-Preis
32,28
Ersparnis zu Amazon 19% oder 7,71

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles

Tipp einsenden