Drei OCR-Programme für Windows im Vergleich

OCR-Programme analysieren Bilddateien auf erkennbare Zeichen und speichern erkannten Text etwa als PDF- oder Office-Dokument. Wir haben drei Programme getestet.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Lesezeit: 6 Min.
Von
  • Dr. Hans-Peter Schüler
Inhaltsverzeichnis

Bevor ein Programm Texte in Bildern interpretieren und verarbeiten kann, muss es die einzelnen Pixelgruppen möglichst fehlerfrei als Buchstaben und Ziffern identifizieren und als Text speichern.

Die optische Zeichenerkennung – auf Englisch: Optical Character Recognition (OCR) – lässt sich für mehrere Zwecke nutzen: In der einfachsten Form liefert sie die Textinhalte aus Scans oder Fotos von Texten. Die Zeichenfolgen des Bildes lassen sich dann am PC durchsuchen, markieren und kopieren.

Die hier vorgestellten OCR-Pakete transformieren Vorlagen auf Wunsch in Office-Dokumente etwa vom Format DOCX, ODT oder durchsuchbares PDF, die der Anwender weiter bearbeiten kann. Dazu bedarf es in vielen Fällen recht ausgefuchster Funktionen, etwa um eine Designer-Schrift aus der Vorlage durch einen ähnlichen Font des Arbeitsplatzrechners zu ersetzen. Und damit ist es noch nicht getan: Während sich der Lesefluss in einem Brief oder einer Buchseite von selbst ergibt, muss ein Programm bei einem mehrspaltigen Text erst einmal herausfinden, in welcher Reihenfolge die Wörter eines Prospekts oder einer Zeitschriftenseite zusammengehören.