Texterkennung genau anpassen: Mit Python Texte in Bildern erkennen

Mit ein paar Zeilen Python-Code und Pytesseract lassen sich Texte in Bildern erkennen und damit durchsuchbar machen -- praktisch für fotografierte Dokumente.

Artikel verschenken

6

22.09.2021, 09:01 Uhr

Lesezeit: 12 Min.

heise+ exklusiv

Von

Marvin Strathmann

Texterkennung genau anpassen: Mit Python Texte in Bildern erkennen
- Pytasseract
Booklet digitalisieren
Spielanleitung digitalisieren
Ausblick

Mit Texterkennung werden analoge Dokumente endlich digital. Man scannt eine Rechnung ein und spezielle Programme machen aus der getrockneten Tinte digitale Buchstaben und Ziffern, die man am Rechner kopieren und weiterverarbeiten kann. So wird die Rechnung vollständig durchsuchbar und im Dateiwust findet der Nutzer sie leichter wieder.

Mittlerweile gibt es viele Texterkennungs-Tools (OCR/Optical Character Recognition). Manche Scanner liefern sie gleich mit oder Freeware aus dem Netz liest jedes erdenkliche Format ein und versucht Buchstaben zu erkennen. Mit Python und der OCR-Bibliothek Pytesseract können Sie allerdings selbst Texterkennung in Skripte einbauen und den Prozess individuell anpassen. So lassen sich auch schwierige Fälle bearbeiten, bei denen die Standardsoftware des Scanners schlappmacht.

Wir zeigen, wie Sie Pytesseract unter Windows nutzen und Texte damit lesbar machen. Als Beispiel nutzen wir ein Song-Booklet einer unbekannten Band und ein Foto einer Brettspielanleitung. Texterkennung lohnt sich vor allem dann, wenn es für die Dokumente noch keine digitale Version gibt. Mit Pytesseract und Python stimmen Sie die Texterkennung passgenau auf das Ausgangsbild ab und versuchen den Text originalgetreu zu extrahieren.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Plattenspieler-Kaufberatung: Worauf Sie achten sollten

Musik auf Vinyl liegt weiter im Trend und die Auswahl an Plattenspielern steigt. Darauf sollten Sie achten, wenn Sie ins Vinyl-Hobby einsteigen möchten.

Notstrom an die Gastherme: Wie es sicher geht und welche Fallstricke es gibt

Generator für die Therme? Oft scheitert es an Stromqualität, Netztrennung und Normen. Welche Technik nötig ist – und warum DIY riskant ist.

Chrome ausreizen: Datenschutz verbessern, an Vorlieben anpassen

Chrome ist umstritten, aber weiterhin populär. Unser Ratgeber zeigt, wie Sie den Browser datenschutzfreundlicher konfigurieren und sich vor Tracking schützen.

Erwin Schrödinger mit Schrödingers Katze und der Schrödingergleichung

100 Jahre Schrödingergleichung: Warum die Katze noch immer nicht tot ist

Zum Jubiläum der Grundgleichung der Quantenphysik zeigt sich, dass ein frustrierendes Gedankenexperiment aktueller ist als je zuvor.

Comic-Zeichnung von einem Pinguin, der wie an einer Tafel steht, da ist aber ein Terminal was den Inhalt einer Systemd-Unit-Datei anzeigt.

Linux: Systemd-Services verstehen und so eigene Dienste steuern

Auf modernen Linux-Systemen läuft ohne Systemd-Services nichts. Wir zeigen, wie Sie eigene Unit-Dateien erstellen und Systemd-Services optimal für sich nutzen.