FAQ: Wie unterscheiden sich die E-Rechnung und PDF technisch?
Die E-Rechnung wird Pflicht und sie kann auch als PDF-Datei daherkommen. Wir erläutern, worin sich ein PDF technisch vom E-Rechnungsformat unterscheidet.
Eine E-Rechnung kann ein PDF sein, aber nicht jedes PDF eine E-Rechnung: PDFs sind Containerdateien für Texte, Bilder und sogar 3D-Objekte. Für E-Rechnungen braucht es PDF/A-3 mit XML-Daten nach EN 16931 für maschinelle Verarbeitung ab 2025. Wir beantworten die häufigsten Fragen.
Aufbau eines PDF
Früher war das Portable Document Format einfach eine Druckdatei, mittlerweile gibt es unzählige Varianten und ISO-Normen. Was genau kann sich in einem PDF eigentlich verbergen?
Ein PDF-Dokument ist eine Containerdatei, die verschiedene Elemente enthalten kann, darunter Text, Rasterbilder, Vektorgrafiken sowie dynamische Inhalte wie Formulare, Videos, Animationen und 3D-Objekte.
Ursprünglich waren PDFs für statische Inhalte konzipiert, um Druckdateien herzustellen. Diese sollte das Format unabhängig von Anzeigesoftware und -system layoutgetreu wiedergeben – weshalb PDF-Erzeuger die semantischen Strukturen des Originaldokuments nicht beibehalten. Fließtext etwa wird in zahllose Fragmente aufgeteilt, um die Wörter exakt an ihrer ursprünglichen Position festzutackern. In der Regel entstand das PDF deshalb ursprünglich mithilfe eines virtuellen Druckers, der den (PostScript-)Druckstrom in PDF-Code umwandelte.
Später wurde das Grafikmodell um Ebenen und Transparenz erweitert (noch von Adobe als Erfinder des Formats), sodass Bildbearbeitungs- und Layout-Software auch mehrschichtiges PDF exportieren konnten. OCR-Anwendungen wiederum hinterlegen gescannte Dokumente, die ja nur als Pixelbild vorliegen, mit einer durchsuchbaren Textebene. Mit zusätzlichen Erweiterungen entwickelte sich das Format im Laufe der Zeit immer interaktiver. Es kamen Funktionen wie digitale Signaturen, JavaScript und 3D-Objekte hinzu sowie die Möglichkeit, beliebige Dateien als Anhänge einzubetten.
Auch der Export über einen virtuellen Drucker geriet ins Hintertreffen. Moderne Betriebssysteme und Software bieten in der Regel hochwertigen, nativen PDF-Export, der interaktive Elemente wie Inhaltsverzeichnisse, Querverweise und Formularfelder erhält – oder eben passend zum Rechnungslayout eine XML-Datei erzeugt und als Anhang im PDF-Container hinterlegt. PDF 1.7 und seine Ableger sind außerdem ISO-Standard, weshalb sich mittlerweile ein ISO-Komitee um die Weiterentwicklung kümmert.
Klassisches PDF versus E-Rechnung
Warum sind nicht alle PDFs elektronische Rechnungen gemäß der EU-Norm EN 16931?
Man könnte annehmen, dass auch klassische PDFs sämtliche Rechnungsdaten in maschinenlesbarer Form enthalten, wenn man sie zum Beispiel in Word oder LibreOffice Writer erstellt und über die native Exportfunktion ins Portable Document Format konvertiert. Gescannte Dokumente könnte man per OCR mit einer Textebene hinterlegen und dadurch ebenfalls maschinenlesbar machen. Außerdem gibt es mittlerweile zahlreiche Apps oder Funktionen in Banking-Software, die Rechnungen per Bilderkennung interpretieren und Empfänger, Betrag sowie Bankleitzahl in die richtigen Felder der Überweisung eintragen. Trotzdem gelten solche Dokumente nicht als maschinenlesbar im Sinne der EU-Rechnungsnorm EN 16931. Denn die einzelnen Elemente transportieren im PDF-Code keine semantischen Informationen. Diese rekonstruiert eine Software per Layout- und Mustererkennung – ein fehlerbehaftetes Verfahren, das für die Massenverarbeitung nicht ideal ist.
Deshalb müssen ZUGFeRD-Rechnungen, die der EN 16931 entsprechen, die eigentlichen Rechnungsdaten auch in einem strukturierten XML-Format enthalten. Diese XML-Daten sind maschinenlesbar und ermöglichen die automatisierte Verarbeitung. Außerdem müssen sie spezifische Metadaten aus dem ZUGFeRD-Schema angeben: den Dokumenttyp (Invoice), den Dateinamen (factur-x.xml), die Version des aktuellen XML-Schemas und das verwendete ZUGFeRD-Profil, Details siehe unten. Diese Angaben sind notwendig, um die Rechnung eindeutig zu identifizieren und zu verarbeiten. Darüber hinaus müssen der PDF- und der XML-Teil einer ZUGFeRD-Rechnung miteinander verknüpft sein.
Langlebiges PDF/A-3
Was ist PDF/A-3 und warum ist diese Variante als Basis fĂĽr die E-Rechnung verpflichtend?
PDF ist ein ISO-Standard, von dem sich wiederum Unterstandards für bestimmte Einsatzbereiche ableiten: PDF/X für die Druckvorstufe, PDF/UA für Barrierefreiheit und PDF/A für die Langzeitarchivierung. Letzteres soll auch nach Jahrzehnten im Archiv noch darstellbar sein. Deshalb verbietet es beispielsweise proprietäre Kompressionsverfahren oder Skripte (Ausnahme: PDF/A-4, siehe Tabelle). Die Variante PDF/A-3 (ISO 19005-3), wurde im Oktober 2012 veröffentlicht.
Im Unterschied zu PDF/A-2, das nur PDF/A-konforme Dokumente als Attachment akzeptiert, bettet PDF/A-3 beliebige Dateiformate als Anhang ein. Somit transportiert PDF/A-3 auch Excel-, Word-, HTML-, CAD- oder XML-Dateien. Auf diese Weise kann man die Originaldatei zusammen mit dem konvertierten PDF/A aufbewahren oder eben eine Hybridrechnung fĂĽr menschliche und maschinelle Verarbeitung anfertigen.
PDF/A-Versionen im Vergleich​​​​ | ||||
​ | PDF/A-1 | PDF/A-2 | PDF/A-3 | PDF/A-4 |
EinfĂĽhrungsjahr | 2005 | 2011 | 2012 | 2020 |
Basisversion | PDF 1.4 | PDF 1.7 (ISO 32000-1) | ​PDF 1.7 (ISO 32000-1) | PDF 2.0 |
visuelle Reproduzierbarkeit | âś“ | âś“ | âś“ | âś“ |
Unicode-Abbildung | âś“ (PDF/A-1a) | âś“ | âś“ | âś“ |
Einbettung von Zeichensätzen | ✓ | ✓ | ✓ | ✓ |
Einbettung definierter Farbräume | ✓ | ✓ | ✓ | ✓ |
aktive Elemente (JavaScript) | – | – | – | ✓ |
Transparenz | – | ✓ | ✓ | ✓ |
PDF/A-konforme Inhalte einbetten | – | ✓ | ✓ | ✓ |
nicht PDF/A-konforme Inhalte einbetten | – | – | ✓ | ✓ |
Grund für Erweiterung | – | Nutzbarkeit erhöhen | Einbettung beliebiger Dateien, Grundlage für ZUGFeRD | bessere Archivierung ausfüllbarer Formate |
Trojanisches ZUGFeRD?
Kann ein Betrüger nicht im ZUGFeRD-Format eine Rechnungsansicht mit einem ganz anderen XML-Rechnungsschema verknüpfen, sodass mein System automatisiert einen höheren Betrag verbucht als auf der PDF-Ansicht für den menschlichen Sachbearbeiter ausgewiesen steht?
Dass die Rechnungsdaten in zwei verschiedenen Formaten (PDF und XML) redundant gespeichert werden, kann tatsächlich zu Inkonsistenzen führen, wenn Elemente in einem Format geändert werden und im anderen nicht. Somit könnten die PDF-Datei und die XML-Datei unterschiedliche Beträge ausweisen, was einem menschlichen Sachbearbeiter, der lediglich die layoutete Rechnung prüft, nicht auffällt. Auch ein technischer Abgleich, etwa per Layout- oder Bilderkennung, ist nicht zuverlässig genug und ließe sich torpedieren – beispielsweise indem der Betrüger den Rechnungstext in Vektorgrafiken umwandelt.
XML zählt
Und welcher Teil ist nun maĂźgeblich? Der visuelle oder der maschinenlesbare?
Das war anfangs nur unzureichend geregelt: Maßgeblich war das, was der Empfänger in seinem Prozess als maßgeblich festgelegt hatte. In einer Stellungnahme vom 22. September 2023 hat das Bundesfinanzministerium (BMF) schließlich etwas mehr Klarheit geschaffen: Bis Ende 2024 hatte demnach die Bilddatei (PDF) und damit die Lesbarkeit durch das menschliche Auge Vorrang. Ab dem 1. Januar 2025 gelten die Daten aus dem strukturierten Teil (XML) als verbindlich. Denn ab diesem Datum müssen Unternehmen die E-Rechnung empfangen und verarbeiten können – die maschinelle Verarbeitung steht also im Vordergrund.
Welches Profil fĂĽr welchen Zweck?
Es gibt fĂĽnf verschiedene ZUGFeRD-Profile (Minimum, Basic WL sowie EN 16931 in den Varianten Comfort, Extended und XRechnung). Welches eignet sich wofĂĽr?
Die Basic-Profile Minimum und Basic WL sind nicht konform zu EN 16931. Sie erlauben keine Rechnungsprüfung, sondern eignen sich nur als Buchungshilfe und zur Archivierung, da sie lediglich rudimentäre Daten in teilweise strukturierter Form enthalten. EN 16931 Comfort enthält zusätzliche Informationen, die eine automatische Zuordnung zu einem Vorgang und eine Rechnungsprüfung ermöglichen. Das empfohlene Format – unter anderem auch für Handwerkerrechnungen – ist das Extended-Profil, da sich die Rechnungsdaten damit umfassend automatisiert verarbeiten lassen. Das Profil XRechnung gibt anstelle des Hybrid-PDFs nur eine reine XML-Datei aus. Es wurde eingeführt, damit Firmen mit ihrer ZUGFeRD-Software auch Rechnungen erstellen können, die die Vorgaben öffentlicher Einrichtungen erfüllen.
(atr)