PDF-Standard bekommt Brotli-Kompression für 20 Prozent kleinere Dateien

Die PDF Association führt Brotli als neuen Kompressionsfilter für PDF 2.0 ein. Tests zeigen durchschnittlich 20 Prozent kleinere Dateien gegenüber Deflate.

vorlesen Druckansicht 19 Kommentare lesen
Dokumente mit Comic-Symbolen, blauer Hintergrund

(Bild: heise medien)

Lesezeit: 3 Min.
Inhaltsverzeichnis
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Die PDF Association hat angekündigt, den Kompressionsalgorithmus Brotli als neuen Filter in den PDF-2.0-Standard zu integrieren. Konkret verspricht die Neuerung durchschnittlich 20 Prozent kleinere PDF-Dateien ohne Qualitätsverlust. Erste Sample-PDFs für Entwickler sind bereits verfügbar.

Brotli ist ein freier Kompressionsalgorithmus von Google, der ursprünglich für statische Web-Assets entwickelt wurde und in RFC 7932 spezifiziert ist. Anders als das bisher in PDFs eingesetzte Deflate-Verfahren, das auch in ZIP- und GZIP-Archiven zum Einsatz kommt, erreicht Brotli bei maximaler Kompression eine höhere Datendichte. Der neue Filter „BrotliDecode“ ergänzt die bestehenden PDF-Kompressionsverfahren wie DCTDecode für JPEG, JPXDecode für JPEG 2000 oder FlateDecode für Deflate.

In einer Diskussion auf Hacker News teilten Entwickler Testergebnisse mit verschiedenen PDF-Sammlungen. Bei 55 Testdateien erreichte Brotli eine Gesamtgröße von 37,06 MByte, während Deflate 38,80 MByte benötigte – ein Vorteil von rund 4,5 Prozent. Eine einzelne 15-MByte-Datei schrumpfte auf 4,5 MByte, eine 19-KByte-Rechnung auf 16,1 KByte. Die tatsächlichen Kompressionsgewinne hängen stark vom Inhalt ab, da viele PDFs bereits Deflate-komprimierte Datenströme enthalten.

Videos by heise

Zum Vergleich testeten Nutzer auch Zstandard (Zstd), einen von Facebook entwickelten Kompressionsalgorithmus. Bei maximalen Einstellungen (Brotli Level 11, Zstd Level 22) zeigte sich Brotli in den meisten Fällen minimal überlegen. Allerdings ist Zstd bei der Dekompression etwa doppelt so schnell – ein relevanter Faktor für PDFs, die häufig geöffnet werden.

Allerdings äußert ein Teil der Community Bedenken hinsichtlich der Abwärtskompatibilität. PDF gilt als Archivformat, das über Jahrzehnte lesbar bleiben muss. Ältere PDF-Reader, die den Brotli-Filter nicht kennen, können die komprimierten Inhalte nicht darstellen. Die PDF Association betont zwar, dass neue Features „nahtlos mit existierenden Readern“ funktionieren sollen, doch die Einführung eines unbekannten Filters widerspricht diesem Prinzip.

Adobe Acrobat Reader unterstützt Brotli-komprimierte PDFs derzeit noch nicht. Auch in Browser-PDF-Viewern ist die Unterstützung uneinheitlich: Chrome könnte über seine integrierte Brotli-Bibliothek einen Vorteil haben, während Firefox und Edge vorerst auf Updates angewiesen sind. Open-Source-Projekte wie MuPDF und Ghostscript arbeiten laut PDF Association an experimentellen Implementierungen, während die PDF-Bibliothek iText bereits Googles Brotli-Referenzcode integriert hat.

Für Organisationen mit großen PDF-Archiven ergeben sich erhebliche Einsparpotenziale. Bei einem Datenbestand von einem Petabyte entsprechen 20 Prozent Kompressionsgewinn 200 Terabyte weniger Speicherbedarf. In Deutschland ist das besonders für GoBD-konforme Archivierung und ZUGFeRD-Rechnungen relevant, bei denen elektronische Dokumente langfristig aufbewahrt werden müssen.

Die PDF Association hat den Brotli-Filter im Rahmen ihrer Technical Working Groups entwickelt. Auf dem Symposium on Advancing the PDF Imaging Model im Oktober 2023 hatte die Organisation um Feedback zu verschiedenen Verbesserungen gebeten, darunter auch neue Kompressionsverfahren. Neben Brotli wurden auch Zstandard und XZ evaluiert. Die endgültige Aufnahme in die ISO-32000-Spezifikation wird für 2026 oder 2027 erwartet, ein konkreter Termin steht noch nicht fest.

Parallel diskutiert die PDF Association weitere Kompressionsverfahren wie JPEG XL für Bilddaten. Das über 30 Jahre alte PDF-Format soll so an moderne Anforderungen angepasst werden, während gleichzeitig die Kompatibilität mit bestehenden Dokumenten gewahrt bleibt – ein Spagat, der sich bei Brotli als besondere Herausforderung erweist.

(fo)