Bild: Pikisuperstar & Balintseby, freepik.com; Montage: Mac & i

Textsicher

OCR mit Vision-Framework

Apples Texterkennung funktioniert gut, erfordert aber einigen manuellen Aufwand, wenn viele Bilder oder ein mehrseitiges PDF vorliegen. Ein selbst geschriebenes Skript schafft Abhilfe und lässt sich vielseitig einbinden.

Von Christian Kirsch

Seit macOS 12 respektive iOS 13 erkennen native Programme wie Apples Fotos und Vorschau Texte in Bildern und PDFs automatisch. Mit Copy und Paste kann man diese Texte extrahieren und in anderen Programmen weiterverwenden. Will man allerdings viele Bilder oder PDFs verarbeiten und die Texte in anderen Dateien verwenden, ist dieses manuelle Vorgehen mühsam, zeitaufwendig und fehlerträchtig. Unter Zuhilfenahme des für die Texterkennung zuständigen Vision-Frameworks ließe sich der Vorgang mit einer Swift- oder Objective-C-Anwendung automatisieren.

Dasselbe können auch Skripte erreichen. Sie haben den Vorteil, dass man sie mit vielen unterschiedlichen Apps verbinden kann, die keine direkte Schnittstelle für klassische Programmiersprachen bieten. Erstellen können Sie Skripte unter anderem mit JavaScript. Es stellt wie das ältere AppleScript eine Brücke zu den Objective-C-Schnittstellen vieler Frameworks bereit.

Textsicher

OCR mit Vision-Framework

Angebot auswählen und weiterlesen

Alle heise-Magazine mit heise+ lesen

Das digitale Abo für IT und Technik.

Alle Ausgaben freischalten

Ausgabe einmalig freischalten