Tesseract OCR Download:
Quelloffene Texterkennung
Der Tesseract OCR Download installiert eine kostenlose Software zur optischen Texterkennung, mit der Sie Texte aus Bildern als lesbaren Text extrahieren.
Die Bedienung von Tesseract OCR 5.5 erfolgt dabei über die Kommandozeile von Windows, wobei neben Englisch und Deutsch noch zahlreiche andere Sprachen unterstützt werden.
Tesseract OCR
Während der Installation können Sie nicht benötigte Komponenten abwählen und zusätzliche hinzufügen, darunter auch weitere Sprachdaten. Hier sollten Sie zumindest Deutsch beziehungsweise German auswählen.
Dazu öffnen Sie über die Suche im Startmenü Systemumgebungsvariablen bearbeiten > Umgebungsvariablen > Systemvariablen > Path > Bearbeiten. Fügen Sie nun den Installationspfad hinzu (etwa C:\Program Files\Tesseract-OCR).
Anschließend klicken Sie im Fenster Umgebungsvariablen unter Systemvariablen auf den Button Neu. Geben Sie als Namen TESSDATA_PREFIX und als Pfad C:\Program Files\Tesseract-OCR\tessdata (oder an das Installationsverzeichnis angepasst) ein.
Möchten Sie Ihre Dokumente nicht über die Kommandozeile, sondern lieber über eine grafische Benutzeroberfläche umwandeln, können Sie stattdessen gImageReader verwenden, das auf Tesseract OCR basiert.
Die Bedienung von Tesseract OCR 5.5 erfolgt dabei über die Kommandozeile von Windows, wobei neben Englisch und Deutsch noch zahlreiche andere Sprachen unterstützt werden.
Tesseract OCR
Tesseract OCR Download & Installation
Tesseract OCR läuft in der hier bereitgestellten Version unter Windows 7 und neueren Versionen des Betriebssystems (32-Bit sowie 64-Bit). Auf GitHub finden Sie zusätzlich den Quellcode.Während der Installation können Sie nicht benötigte Komponenten abwählen und zusätzliche hinzufügen, darunter auch weitere Sprachdaten. Hier sollten Sie zumindest Deutsch beziehungsweise German auswählen.
Erste Schritte mit Tesseract OCR
Im Anschluss sollten Sie den Installationsordner von Tesseract zur PATH-Umgebungsvariable hinzufügen. Das vereinfacht die Verwendung des Tools über die Eingabeaufforderung von Windows.Dazu öffnen Sie über die Suche im Startmenü Systemumgebungsvariablen bearbeiten > Umgebungsvariablen > Systemvariablen > Path > Bearbeiten. Fügen Sie nun den Installationspfad hinzu (etwa C:\Program Files\Tesseract-OCR).
Anschließend klicken Sie im Fenster Umgebungsvariablen unter Systemvariablen auf den Button Neu. Geben Sie als Namen TESSDATA_PREFIX und als Pfad C:\Program Files\Tesseract-OCR\tessdata (oder an das Installationsverzeichnis angepasst) ein.
Einfache Texterkennung
Möchten Sie den Text eines Bildes als maschinenlesbaren Text in ein neues Dokument extrahieren, öffnen Sie die Eingabeaufforderung von Windows und geben den Befehl tesseract inputbild.jpg ausgabedatei -l deu ein, wobei Sie diesen natürlich an den Namen des Bildes und die zu erkennende Sprache anpassen müssen.Tesseract OCR Hilfe & Alternative
Der Einsatz von Tesseract OCR über die Kommandozeile ist somit zwar recht einfach, dennoch kann sich ein Blick in das offizielle Benutzerhandbuch oder ein Besuch im GitHub-Repositorium lohnen.Möchten Sie Ihre Dokumente nicht über die Kommandozeile, sondern lieber über eine grafische Benutzeroberfläche umwandeln, können Sie stattdessen gImageReader verwenden, das auf Tesseract OCR basiert.
Thema:
Inhalte zu diesem Download:
Das könnte Sie auch interessieren
Verwandte Downloads
Neueste Downloads
Neues aus dem Software-Forum
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!