OCR-Software zur Digitalisierung ausgedruckter Dokumente

Ausgedrucktes lässt sich mit dem Smartphone oder Scanner und einer Texterkennungs-Software im Handumdrehen digitalisieren. Wir stellen 15 OCR-Tools für Windows, Android und iOS vor.

In Pocket speichern vorlesen Druckansicht 33 Kommentare lesen
Praktische OCR-Software zur Texterkennung
Lesezeit: 3 Min.
Von
  • Miriam Abels
  • Dr. Hans-Peter Schüler
Inhaltsverzeichnis

Sie möchten ausgedruckte Dokumente in durchsuchbare und editierbare Textdateien umwandeln? Dann brauchen Sie eine Digitalisierungs-Software: Per optischer Zeichenerkennung (Optical Character Recognition, OCR) verwandelt das Programm Bildmuster in Buchstaben und Ziffern.

Wenn Texte, Tabellen und Bilder nur in ausgedruckter Form vorliegen, lassen sich diese mit einem Scanner oder der Smartphone-Kamera und einer passenden OCR-Anwendung digitalisieren. Anschließend können Sie die gescannten Dokumente durchsuchen, bearbeiten oder verschlagworten.

Meist werden die per OCR digitalisierten Texte im DOCX-, ODT- oder PDF-Format gespeichert, von wo aus sie sich recht einfach weiterverarbeiten lassen. Da OCR-Anwendungen in der Regel mit Wörterbüchern arbeiten, können sie unterschiedliche Sprachen identifizieren. Es gibt OCR-Software für den Scanner am stationären Windows-PC und OCR-Apps für die mobile Digitalisierung mit dem Smartphone.

OCR-Tools für Windows digitalisieren Dokumente bei Bedarf ohne große Rückfragen. So können sie in einer Büroumgebung selbstständig Eingangsordner überwachen und dort eintreffende Dokumente automatisch verarbeiten. Im interaktiven Betrieb lassen sich mit ihnen Scanner- und Rechenparameter justieren und man kann zum Beispiel festlegen, welche Bereiche eines Bildes die Software als Fließtext, Grafik oder Tabelle behandeln soll.

Die drei von c't getesteten OCR-Programme für Windows (ausführlicher Test) bringen mehr als 100 Wörterbücher in unterschiedlichen Landessprachen mit, einige auch Spezialwörterbücher etwa für Medizin, Jura oder Programmiersprachen. Im Test prüften wir die fehlerfreie Zeichenerkennung, logisch richtige Gliederung der Ausgabedokumente, die Berücksichtigung typografischer Details wie Schriftgröße und -font und nicht zuletzt, wie komfortabel es sich mit den OCR-Paketen arbeiten lässt.

OCR-Anwendungen für Windows (3 Bilder)

FineReader 14

Abbyys FineReader 14 bringt eine Bildbearbeitung, einen PDF-Editor und einen Screenshot-Reader mit. Die Bedienerführung ist übersichtlich, der Funktionsumfang riesig. Die OCR exportiert Dateien für E-Book-Reader und erkennt Programmiersprachen. Statt einer Direkthilfe gibt es nur Links zu Support-Webseiten.


Abbyy FineReader 14 gibt es für Windows für 200 €.

Das Handy ist immer und überall dabei – und kann praktischerweise gleich als Scanner genutzt werden. Mit OCR-Apps lassen sich Dokumente nach dem Abfotografieren einfach in Textdateien mit eingebundenen Bildern umwandeln. Zwar können die Apps nicht mit extrem komplexen Vorlagen umgehen, für die meisten Alltagsfunktionen reichen sie jedoch aus.

Alle sechs von c't getesteten OCR-Apps für Android (ausführlicher Test) funktionieren auch offline und sind in der Basisversion kostenlos. Voraussetzung ist eine ordentliche Aufnahme, wichtig der richtige Abstand des Smartphones zum Dokument – zu dicht dran gerät die Aufnahme unscharf, aus zu großer Entfernung wird die Schrift zu klein. Faustregel für die Digitalisierung von DIN-A4-Seiten: Beim Fotografieren 20 bis 30 Zentimeter Abstand halten.

OCR-Apps für Android (6 Bilder)

CamScanner

CamScanner (Download) kann in der Basis-Version deutlich weniger als in der Bezahlvariante; das gilt auch für die Texterkennung. Die Premium-Version glänzt durch gute Kamera-Ausrichtung und Layout-Erkennung selbst schwieriger Vorlagen. Sie bringt einen Batch-Modus, eine Ausweis-Funktion und PDF-Verschlüsselung mit.

Die Premium-Version kostet ca. 50 € im Jahr (bei besonders häufiger Nutzung können Zusatzkosten anfallen).

Auch für iPhones und iPads gibt es praktische Apps für die Texterkennung in Handyaufnahmen. Die sechs von c't getesteten OCR-Apps für iOS (ausführlicher Test) funktionieren auch offline und sind zu erschwinglichen Preisen erhältlich. Voraussetzung ist auch hier, ein möglichst gutes Foto von dem zu digitalisierenden Dokument zu schießen. Im Idealfall fotografiert man einen DIN-A4-Brief aus einem Abstand von rund 30 Zentimeter genau senkrecht zur Papierebene und so, dass die Textzeilen parallel zum Bildrand verlaufen. Als unkritisch haben sich die Beleuchtungsverhältnisse beim Scannen erwiesen, eine eingeschaltete Deckenbeleuchtung reichte meist.

Beim Test haben wir uns auf den Einsatz unterwegs konzentriert und dafür ein iPad Air und stichprobenweise zusätzlich ein iPhone 7 jeweils unter iOS 12.1 verwendet. Achtung: Manche OCR-Apps präsentieren sich auf dem iPhone unter einem anderen Namen als im App-Store.

OCR-Apps für iOS (6 Bilder)

Doc Scanner + OCR

Doc Scanner + OCR bietet nur wenig Möglichkeiten zur Bildoptimierung, die Texterkennung funktioniert aber auch in der kostenlosen Variante sehr gut. Man kann am Scan Anmerkungen einfügen, weniger erfreulich ist die Bedienung. Die als PDF digitalisierten Dokumente sind nicht durchsuchbar. Die Premium-Version verzichtete erst einige Tage nach der Installation auf Werbeeinblendungen.
Die kostenpflichtige Premium-Version gibt es für 3,49€.

(hps)