Google indiziert nun auch gescannte Bilder in PDFs
Der Suchmaschinenbetreiber Google kann zukünftig noch umfassendere Inhalte in seinen Index aufnehmen, die als PDF-Dateien vorliegen. Dafür wurde eine OCR-Engine in den Spider integriert.
Diese ermöglicht es, die elektronischen Dokumente über eine Schrifterkennung zu analysieren. Dies ist beispielsweise von Vorteil, wenn der Text in einem PDF von einem eingescannten Schriftstück stammt. Das Ergebnis kann anschließend ebenso indiziert werden, wie herkömmliche Textdokumente.
Die Technologie könnte zukünftig auch auf Bilddateien ausgedehnt werden. Allerdings wäre hierbei wohl eine Vorsortierung notwendig, um nicht unnütz Rechenleistung auf Fotos zu verschwenden, die keinerlei Text enthalten.
- Nachricht versenden
- Kommentieren
- Hinweis einsenden
Diese Nachricht empfehlen:
Schreiben Sie uns Ihre Meinung, bewerten Sie Kommentare oder diskutieren Sie mit anderen WinFuture.de Lesern!
Melden Sie sich jetzt kostenlos anoder verwenden Sie Ihren bestehenden Zugang.
Beliebte Downloads
Neue Nachrichten
Beliebte Nachrichten
Videos
Christian Kahle
Redakteur bei WinFuture
Ich empfehle ...
WinFuture Mobil
Auch Unterwegs bestens informiert!Nachrichten und Kommentare auf
dem Smartphone lesen.
Meist kommentierte Nachrichten
Community
- H1o84 - vor 0 Sekunden
in der Rubrik News - jüki - vor 3 Minuten
in der Rubrik News - andi1983 - vor 9 Minuten
in der Rubrik News - Conos - vor 14 Minuten
in der Rubrik News
Forum
-
USB-Stick reparieren
Doodle - vor 30 Sekunden -
Gruppenrichtlinie
metalazo4803 - vor 12 Minuten -
Hauptseite: per mobile einloggen/kommentare schreiben?
nobody is perfect - vor 21 Minuten -
Firefox führt nur Google-Links nicht mehr aus !
pubsfried - vor 21 Minuten -
GTX 570@x8?
MacFreak90 - vor 29 Minuten
MSDN Online
News rund ums Web
HTML5 ? die Serie: Alles über Web-Standards
22.12.2011
MSDN Hotline: "Pinned Sites" im Fokus
19.09.2011
WP7 App: MSDN Online auf dem Windows Phone
15.09.2011





Alle Kommentare zu dieser News anzeigen