CROSSCAP V4 Handbuch
Texterkennung (Wissenswertes)
Bedienungsanleitung CROSSCAP V4 > Wissenswertes > Texterkennung (Wissenswertes)

Für die Texterkennung (OCR) nutzt CROSSCAP V4 standardmäßig die Open-Source Engine Tesseract (Tesseract wird zurzeit von GoogleCode betreut und weiterentwickelt).

Die besten Texterkennungs-Ergebnisse erzielen Sie, wenn Sie Vorlagen mit möglichst geringem Bildanteil verwenden, welche Sie dann bi-tonal und mit hoher Auflösung scannen sollten.

 

Grundeinstellungen

Vor der ersten Nutzung der Texterkennungsfunktionen sollten Sie alle nötigen Grundeinstellungen vornehmen (in den Programmeinstellungen, Abschnitt Texterkennung). 

 

Fortlaufende Texterkennung (Volltext)

Die CROSSCAP V4 Texterkennung ist in der Lage, Text über alle Bilder eines Stapels hinweg zu erkennen und daraus z.B. PDF-Dateien mit hinterlegtem Text (Volltext-PDFs, searchable PDFs) zu erzeugen. Die Texterkennung wird in diesen Fällen in den entsprechenden Export-Einstellungen konfiguriert, jeweils im Abschnitt Texterkennung.

Folgende Export-Formate bieten diese Art der Texterkennung an:

PDF/A-Datei

TXT-Datei

XML-Datei

 

Zonen-Texterkennung (Zonale OCR)

Sie können die CROSSCAP V4 Texterkennung auch verwenden, um nur ausgewählte Bereiche (sog. Suchbereiche) erkennen zu lassen.

Diese sog. Zonen-OCR kann auf zweifache Weise angewendet werden: