c't 3/2026
S. 152
Praxis
PDF-Formulare auslesen
Bild: Ulrike Weis / KI / heise medien

PDF-Formulare im Griff

Daten automatisiert auslesen und verarbeiten

PDF-Formulare versprechen digitale Abläufe, führen in der Praxis aber oft zu Medienbrüchen. Dieser Artikel zeigt, wie sich Informationen automatisiert aus PDF-Formularen auslesen lassen. Ohne Medienbrüche, proprietäre Software oder Abos.

Von Tomas Jakobs

Eine Mail trudelt ein, im Anhang ein PDF-Formular zum Ausfüllen. Vermeintlich digital, tatsächlich aber der Startschuss für eine analoge Tragödie. Viele PDFs sehen zwar aus wie Formulare, lassen sich aber nicht am Bildschirm ausfüllen, weil sie keine interaktiven Felder besitzen. Also wird gedruckt, per Hand ausgefüllt, wieder eingescannt oder fotografiert und zurückgeschickt. So mutiert das einst aus Vektoren und Text bestehende Dokument zum reinen Pixelbild – oder zum PDF mit eingebettetem Pixelbild, was auch nicht besser ist. Denn zum einen fallen die gerasterten Varianten deutlich größer aus als das Original, zum anderen lässt sich ihr Inhalt nur noch per Umweg über Optical Character Recognition (OCR) maschinell auslesen. Sprich: Das ist das Gegenteil eines gelungenen digitalen Workflows.

Doch selbst interaktive PDF-Formulare, die wie vorgesehen am Rechner ausgefüllt und zurückgeschickt wurden, enden häufig als Karteileichen oder bei einer Bürokraft zum Abtippen. Oft mangelt es an Wissen oder geeigneter Software, um die darin enthaltenen und bereits strukturierten Informationen auszulesen und zu verarbeiten. Gängige Dokumentenmanagementsysteme oder kostenlose PDF-Betrachter können die Paare aus Formularfelddefinition und eingegebenem Wert in der Regel nicht exportieren. Editoren von Acrobat und Foxit exportieren zwar prinzipiell die Daten, sind aber teuer, zwingen zum Abo und ermöglichen keinen durchgehend automatisierten Workflow. Auf Automatisierung spezialisierte Serversysteme sind noch teurer und kommen deshalb für kleinere und mittelgroßen Firmen oft nicht infrage.

Alle heise-Magazine mit heise+ lesen

3,99 € / Woche

Ein Abo, alle Magazine: c't, iX, Mac & i, Make & c't Fotografie

  • Alle heise-Magazine im Browser und als PDF
  • Alle exklusiven heise+ Artikel frei zugänglich
  • heise online mit weniger Werbung lesen
  • Vorteilspreis für Magazin-Abonnenten
Jetzt unbegrenzt weiterlesen Vierwöchentliche Abrechnung.

Alle Ausgaben freischalten

2,95 € 0,25 € / Woche

Nach Testphase 2,95 € wtl.

  • Zugriff auf alle c't-Magazine
  • PDF-Ausgaben zum Herunterladen
  • Zugriff in der c't-App für unterwegs
Jetzt testen Nach Testphase jederzeit monatlich kündbar.

Ausgabe einmalig freischalten

6,20 € / Ausgabe

Diese Ausgabe lesen – ohne Abobindung

  • Sicher einkaufen im heise shop
  • Magazin direkt im Browser lesen
  • Dauerhaft als PDF behalten

Kommentieren