Texterkennung (Wissenswertes)

Für die Texterkennung (OCR) nutzt CROSSCAP V4 standardmäßig die Open-Source Engine Tesseract (Tesseract wird zurzeit von GoogleCode betreut und weiterentwickelt).

Die besten Texterkennungs-Ergebnisse erzielen Sie, wenn Sie Vorlagen mit möglichst geringem Bildanteil verwenden, welche Sie dann bi-tonal und mit hoher Auflösung scannen sollten.

Grundeinstellungen

Vor der ersten Nutzung der Texterkennungsfunktionen sollten Sie alle nötigen Grundeinstellungen vornehmen (in den Programmeinstellungen, Abschnitt Texterkennung).

Fortlaufende Texterkennung (Volltext)

Die CROSSCAP V4 Texterkennung ist in der Lage, Text über alle Bilder eines Stapels hinweg zu erkennen und daraus z.B. PDF-Dateien mit hinterlegtem Text (Volltext-PDFs, searchable PDFs) zu erzeugen. Die Texterkennung wird in diesen Fällen in den entsprechenden Export-Einstellungen konfiguriert, jeweils im Abschnitt Texterkennung.

Folgende Export-Formate bieten diese Art der Texterkennung an:

PDF/A-Datei

TXT-Datei

XML-Datei

Zonen-Texterkennung (Zonale OCR)

Sie können die CROSSCAP V4 Texterkennung auch verwenden, um nur ausgewählte Bereiche (sog. Suchbereiche) erkennen zu lassen.

Diese sog. Zonen-OCR kann auf zweifache Weise angewendet werden:

Zum einen automatisiert, zum Beispiel um ein Indexfeld zu füllen. Alle hierfür nötigen Einstellungen sind vor dem Projektstart vorzunehmen. Ausführliche Informationen hierzu finden Sie im Kapitel Projekteinstellungen im Abschnitt Bildverarbeitung unter Texterkennung.

Zum anderen ist es während eines Projektes möglich, OCR-Bereiche manuell (durch Festlegen eines Erkennungsbereiches mit der Maus) zu erfassen. Mehr Details hierzu finden Sie im Kapitel Menü und Funktionen, im Abschnitt Reiter Bearbeiten.