CROSSCAP TR Resiscan Handbuch
Texterkennung (Wissenswertes)
Bedienungsanleitung CROSSCAP > Wissenswertes > Texterkennung (Wissenswertes)

Für die Texterkennung (OCR) nutzt CROSSCAP standardmäßig die Open-Source Engine Tesseract (Tesseract wird zurzeit von GoogleCode betreut und weiterentwickelt).

Die besten Texterkennungs-Ergebnisse erzielen Sie, wenn Sie Vorlagen mit möglichst geringem Bildanteil verwenden, welche Sie dann bi-tonal und mit hoher Auflösung scannen sollten.

 

Grundeinstellungen

Vor der ersten Nutzung der Texterkennungsfunktionen sollten Sie alle nötigen Grundeinstellungen vornehmen (in den Programmeinstellungen, Abschnitt Texterkennung). 

 

Fortlaufende Texterkennung (Volltext)

Die CROSSCAP Texterkennung ist in der Lage, Text über alle Bilder eines Stapels hinweg zu erkennen und daraus z.B. PDF-Dateien mit hinterlegtem Text (Volltext-PDFs, searchable PDFs) zu erzeugen. Die Texterkennung wird in diesen Fällen in den entsprechenden Export-Einstellungen konfiguriert, jeweils im Abschnitt Texterkennung.

Folgende Export-Formate bieten diese Art der Texterkennung an:

PDF/A-Datei

TXT-Datei

XML-Datei

 

Zonen-Texterkennung (Zonale OCR)

Sie können die CROSSCAP Texterkennung auch verwenden, um nur ausgewählte Bereiche (sog. Suchbereiche) erkennen zu lassen.

Diese sog. Zonen-OCR kann auf zweifache Weise angewendet werden: