Barrierefreie PDFs: KI-Modelle unterstützen und sparen Zeit
Damit Screenreader ein PDF sinnvoll wiedergeben können, braucht das Dokument eine akkurate Tag-Struktur. KI-Modelle erstellen diese automatisiert – gut genug?
(Bild: Ulrike Weis / KI / heise medien)
Seit Juni 2025 verlangt der Gesetzgeber von kommerziellen Websitebetreibern, ihre Inhalte barrierefrei zu publizieren. Das gilt auch für PDFs, die Firmen und Behörden zum Download stellen. Die gängigen Office-Pakete wie Microsoft 365 oder LibreOffice sowie professionelle Desktop-Publishing-Programme wie InDesign exportieren Dokumente mittlerweile im dafür geschaffenen PDF/UA-Standard (UA steht für Universal Accessibility). Dieser Direktexport ist mit großem Abstand der einfachste und empfehlenswerteste Weg hin zur Barrierefreiheit, aber keine Garantie dafür, dass das Dokument tatsächlich barrierefrei ist. Das ist es nur, wenn ein Screenreader alle relevanten Inhalte korrekt interpretieren und in der richtigen Reihenfolge wiedergeben kann.
Schon seit geraumer Zeit gibt es Prüfwerkzeuge, mit denen sich automatisiert testen lässt, ob ein PDF technische und formelle Kriterien der Barrierefreiheit erfüllt: etwa ob jedes Bild einen Beschreibungstext (Alternativtext, Alt-Text) hat, den Screenreader vorlesen können. Übrig bleiben dennoch eine ganze Reihe an Tests und potenziellen Korrekturschritten, die sich ausschließlich manuell durchführen lassen. Denn nur Menschen können zuverlässig beurteilen, ob ein Alternativtext auch wirklich zum Bildinhalt passt – und ihn bei Bedarf ändern. Oder ob einzelne Textelemente in der korrekten Reihenfolge stehen, sodass sie beim Vorlesen einen sinnvoll zusammenhängenden Text ergeben.
- Damit ein PDF barrierefrei ist und von Screenreadern vorgelesen werden kann, muss es mit Tags strukturiert sein.
- Machine-Learning-Modelle und insbesondere generative KI kann helfen, komplett unstrukturierte PDFs nachträglich zugänglicher zu machen.
- Die Technik eignet sich noch nicht für den voll automatisierten Einsatz, hilft aber bei einfacheren bis mittelkomplexen Dokumenten schon gut, um die gröbsten Barrieren zu finden und zu beseitigen.
Die knifflige Inhaltsanalyse beginnt bei Bildern und Grafiken, geht weiter bei der Tabellen- und Listenerkennung und gipfelt darin, bei komplexen Layouts den korrekten Textfluss für Screenreader zu rekonstruieren oder zu riesigen, unstrukturierten Dokumenten ein Inhaltsverzeichnis zu erstellen. Fortschritte im Machine Learning und insbesondere bei den generativen Modellen wecken die Hoffnung, dass sich all diese zeitraubenden Aufgaben eines Tages komplett automatisieren lassen; insbesondere die großen Sprach- und Bildmodelle kann man mehr und mehr dazu einspannen, Layout und Inhalt semantisch zu interpretieren. Wir geben einen Überblick, was die Technik schon kann, wo sie noch passen muss – und welche Tools das Taggen und Prüfen erleichtern. Auch deutsche und europäische Anbieter treiben die Entwicklung voran.
Das war die Leseprobe unseres heise-Plus-Artikels "Barrierefreie PDFs: KI-Modelle unterstützen und sparen Zeit". Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.