PDF-Komprimierung verstehen: Balance zwischen Qualität und Dateigröße

Die Grundlagen der PDF-Komprimierung

Die Komprimierung in PDF-Dokumenten arbeitet auf mehreren Ebenen. Anders als bei einfachen Dateiformaten, bei denen ein einzelner Komprimierungsalgorithmus auf die gesamte Datei angewendet wird, ermöglichen PDFs unterschiedliche Komprimierungsmethoden für verschiedene Inhaltsströme innerhalb desselben Dokuments. Textinhalte, Vektorgrafiken und Rasterbilder haben jeweils unterschiedliche Eigenschaften, die unterschiedlich auf Komprimierungsalgorithmen reagieren, und das PDF-Format nutzt dies, indem es eine Komprimierung pro Strom ermöglicht.

Auf der grundlegendsten Ebene reduziert die PDF-Komprimierung die Dateigröße durch Beseitigung von Redundanz. Verlustfreie Komprimierung identifiziert Muster in den Daten und stellt sie effizienter dar, wobei eine perfekte Rekonstruktion der Originaldaten möglich ist. Verlustbehaftete Komprimierung geht weiter, indem sie als weniger wichtig erachtete Informationen verwirft und so eine größere Größenreduzierung auf Kosten eines gewissen Qualitätsverlusts erzielt. Die Kunst der PDF-Optimierung liegt in der Wahl der richtigen Komprimierungsmethode und Einstellungen für jeden Inhaltstyp.

Die PDF-Spezifikation unterstützt mehrere Komprimierungsfilter, die auf Inhaltsströme angewendet werden können: Flate (zlib/deflate), LZW, JPEG (DCT), JPEG2000 (JPX), CCITT Group 3 und 4, JBIG2 und Lauflängenkodierung. Diese Filter können sogar verkettet werden, wobei mehrere Komprimierungsdurchgänge auf denselben Strom angewendet werden. Zu verstehen, was jeder Filter gut kann und wo er an seine Grenzen stößt, ist für eine effektive PDF-Optimierung unerlässlich.

Verlustfreie Komprimierungsmethoden in PDF

Verlustfreie Komprimierung bewahrt jedes Bit der Originaldaten und ist unverzichtbar für Inhalte, bei denen Genauigkeit zählt, wie Text, Strichzeichnungen und Dokumente, die für Druck oder Archivierung bestimmt sind. Die primäre verlustfreie Komprimierungsmethode in modernen PDFs ist die Flate-Komprimierung, die auf dem Deflate-Algorithmus basiert (derselbe Algorithmus, der in ZIP-Dateien und PNG-Bildern verwendet wird). Flate-Komprimierung erreicht typischerweise ein Komprimierungsverhältnis von 2:1 bis 10:1 bei textlastigen Inhaltsströmen, abhängig von der Redundanz in den Daten.

LZW (Lempel-Ziv-Welch) Komprimierung ist eine ältere verlustfreie Methode, die vor Patentbedenken weit verbreitet war, bevor sie in den meisten Anwendungen durch Flate ersetzt wurde. LZW wird in der PDF-Spezifikation weiterhin unterstützt und kann in älteren Dokumenten vorkommen, aber Flate erreicht in der Regel gleiche oder bessere Komprimierungsverhältnisse und wird universell für neue Dokumente empfohlen.

Für monochrome (1-Bit) Bilder ist die CCITT Group 4-Komprimierung hocheffektiv. Ursprünglich für die Faxübertragung entwickelt, nutzt CCITT Group 4 die Tatsache, dass die meisten Pixel auf einer typischen Dokumentseite weiß sind und schwarze Pixel dazu neigen, sich in vorhersagbaren Mustern zu gruppieren (Textzeichen, Strichzeichnungen). Ein 300-DPI-Schwarzweiß-Scan einer Textseite kann von etwa 1 MB unkomprimiert auf 30–50 KB mit CCITT Group 4 komprimiert werden – ein Verhältnis von 20:1 oder besser.

Verlustbehaftete Komprimierung: JPEG und JPEG2000

JPEG-Komprimierung (DCT-basiert) ist die gängigste verlustbehaftete Komprimierungsmethode für fotografische Inhalte in PDFs. JPEG funktioniert, indem Bilddaten mittels der Diskreten Kosinustransformation in den Frequenzbereich überführt werden. Anschließend werden die Frequenzkoeffizienten quantisiert und hochfrequente Details verworfen, die für das menschliche Auge weniger wahrnehmbar sind. Die Qualitätseinstellung (typischerweise 1–100) steuert, wie aggressiv die Quantisierung Daten verwirft.

JPEG-Qualitätseinstellungen zeigen eine nichtlineare Beziehung sowohl zur Dateigröße als auch zur visuellen Qualität. Eine Reduzierung der Qualität von 100 auf 85 verringert die Dateigröße typischerweise um 50–70 % bei praktisch keinem sichtbaren Qualitätsverlust. Eine Reduzierung von 85 auf 60 bringt eine weitere deutliche Größenreduzierung mit subtiler Qualitätsverschlechterung, die nur bei genauer Betrachtung sichtbar ist. Unter Qualität 40 werden Komprimierungsartefakte (Blockbildung, Ringing und Farbbanding) deutlich sichtbar. Für PDF-Dokumente, die zur Bildschirmansicht bestimmt sind, liegt der optimale Bereich üblicherweise bei 60–75. Für Dokumente, die möglicherweise gedruckt werden, wird Qualität 75–85 empfohlen.

JPEG2000 ist ein modernerer Komprimierungsstandard, der Wavelet-Transformationen anstelle von DCT verwendet. Er erreicht bessere Komprimierungsverhältnisse als JPEG bei gleichwertiger visueller Qualität, insbesondere bei hohen Komprimierungsverhältnissen. JPEG2000 unterstützt auch verlustfreie Komprimierung, progressive Dekodierung (die eine unscharfe Vorschau ermöglicht, die sich mit mehr Daten schärft) und Region-of-Interest-Kodierung. Allerdings hat JPEG2000 höhere Rechenanforderungen und wird nicht von allen PDF-Viewern unterstützt. Es wird in den PDF/A-2- und PDF/A-3-Archivformaten verwendet.

JBIG2-Komprimierung für gescannte Dokumente

JBIG2 ist ein spezialisierter Komprimierungsstandard, der für zweistufige (monochrome) Bilder entwickelt wurde, insbesondere für gescannte Dokumentseiten. Er erreicht eine dramatisch bessere Komprimierung als CCITT Group 4, indem er Mustererkennung und Symbolwörterbücher verwendet. JBIG2 identifiziert wiederkehrende Formen auf einer Seite (typischerweise Buchstaben), speichert eine einzelne Vorlage für jede einzigartige Form und zeichnet dann die Position jeder Instanz auf. Da eine typische Dokumentseite dieselben Zeichen hundertfach wiederverwendet, kann dieser Ansatz eine gescannte Seite mit 300 DPI auf nur 5–15 KB komprimieren.

JBIG2 arbeitet in zwei Modi: verlustfrei und verlustbehaftet. Im verlustfreien Modus wird jede einzigartige Form exakt gespeichert, wobei jedes Pixel erhalten bleibt. Im verlustbehafteten Modus werden ähnliche Formen zu einer einzelnen repräsentativen Vorlage zusammengeführt, was die Komprimierung weiter verbessert, aber möglicherweise Zeichen vertauscht. Dieses verlustbehaftete Verhalten erlangte 2013 Bekanntheit, als entdeckt wurde, dass bestimmte Xerox-Scanner mit verlustbehaftetem JBIG2 stillschweigend Zeichen in gescannten Dokumenten ersetzten – beispielsweise "6" durch "8" in einem Bauplan.

Trotz der Risiken des verlustbehafteten Modus bleibt JBIG2 eine der effektivsten Komprimierungsmethoden für gescannte Dokumente. Wenn Sie JBIG2 verwenden, stellen Sie sicher, dass Ihre Tools entweder den verlustfreien Modus oder einen verlustbehafteten Modus mit strengen Ähnlichkeitsschwellenwerten verwenden, die eine Zeichenvertauschung verhindern. Einige PDF-Optimierungstools ermöglichen es Ihnen, den JBIG2-Ähnlichkeitsschwellenwert zu konfigurieren. Für Dokumente, bei denen die Textgenauigkeit kritisch ist (Recht, Finanzen, Medizin), verwenden Sie verlustfreies JBIG2 oder CCITT Group 4 stattdessen.

Optimierungsstrategien für gemischte Inhalte

PDFs aus der Praxis enthalten typischerweise eine Mischung aus Text, Vektorgrafiken, Fotografien und gescannten Inhalten. Die Optimierung dieser Dokumente erfordert die Anwendung geeigneter Komprimierung auf jeden Inhaltstyp. Das Konzept des Mixed Raster Content (MRC) formalisiert diesen Ansatz: Eine Seite wird in Schichten segmentiert – typischerweise eine Vordergrundschicht (Text und Strichzeichnungen), eine Hintergrundschicht (fotografischer Inhalt) und eine Maskenschicht (die definiert, welche Teile jeder Schicht sichtbar sind).

MRC-Segmentierung ermöglicht die Komprimierung von Text mit JBIG2 oder CCITT Group 4 bei hoher Auflösung (300+ DPI), während Fotografien mit JPEG bei niedrigerer Auflösung (150 DPI) komprimiert werden. Diese Kombination erzielt deutlich bessere Ergebnisse als die Anwendung einer einzelnen Komprimierungsmethode auf die gesamte Seite. Eine gescannte Farbseite, die als einzelnes JPEG-Bild 2 MB groß sein könnte, könnte mit MRC-Segmentierung auf 100–200 KB reduziert werden, mit schärferem Text und akzeptabler Fotoqualität.

Nicht alle PDF-Optimierungstools unterstützen MRC. Zu denjenigen, die es tun, gehören ABBYY FineReader, Kofax und bestimmte Konfigurationen von Ghostscript. Wenn MRC nicht verfügbar ist, können Sie gemischte Inhalte dennoch optimieren, indem Sie sicherstellen, dass der PDF-Erstellungsprozess geeignete Komprimierung pro Inhaltstyp verwendet: Fotografien als JPEG einbetten, während Text und Vektorgrafiken in ihrer nativen Form mit Flate-Komprimierung im Inhaltsstrom belassen werden.

Komprimierungsartefakte und Qualitätsbewertung

Das Verständnis von Komprimierungsartefakten hilft Ihnen, geeignete Einstellungen zu wählen und Optimierungsergebnisse zu bewerten. JPEG-Artefakte umfassen Blockbildung (sichtbare 8×8-Pixel-Rastermuster bei hoher Komprimierung), Ringing (Halos um scharfe Kanten), Farbbanding (glatte Verläufe werden stufig) und Mosquito-Noise (flimmernde Muster um Kanten in Bereichen mit hohem Kontrast). Diese Artefakte sind am sichtbarsten in Bereichen mit Vollfarbe neben feinen Details, genau das Muster, das bei als Bild gerenderten Text vorkommt.

Die Qualitätsbewertung kann objektiv oder subjektiv erfolgen. Objektive Metriken umfassen PSNR (Peak Signal-to-Noise Ratio), SSIM (Structural Similarity Index) und modernere Metriken wie VMAF. PSNR misst das Verhältnis von Signal zu Rauschen in Dezibel; Werte über 40 dB zeigen in der Regel einen nicht wahrnehmbaren Qualitätsverlust an. SSIM arbeitet auf einer Skala von 0–1, wobei 1,0 identisch bedeutet; Werte über 0,95 werden typischerweise als hervorragend angesehen. Diese Metriken korrelieren jedoch nicht immer mit der wahrgenommenen Qualität, da sie das menschliche visuelle System nicht vollständig modellieren.

Für praktische Zwecke ist die beste Qualitätsbewertung die visuelle Inspektion unter den beabsichtigten Betrachtungsbedingungen. Betrachten Sie die komprimierte PDF bei 100 % Zoom auf einem typischen Display für bildschirmoptimierte Dokumente. Für Druckdokumente drucken Sie eine Testseite und vergleichen Sie sie mit der unkomprimierten Version. Achten Sie besonders auf die Textlesbarkeit (insbesondere kleiner Text), fotografische Details in interessanten Bereichen und glatte Verläufe. Wenn Artefakte unter normalen Betrachtungsbedingungen sichtbar sind, reduzieren Sie die Komprimierungsstufe, bis sie verschwinden.

Die richtigen Komprimierungseinstellungen wählen

Die optimalen Komprimierungseinstellungen hängen vom Zweck des Dokuments, dem Inhalt und der Verteilungsmethode ab. Für E-Mail-Anhänge von Geschäftsdokumenten (Text mit einigen Diagrammen und Fotos) verwenden Sie Flate-Komprimierung für Textströme, JPEG-Qualität 65–75 für Fotografien und reduzieren Sie die Bildauflösung auf 150 DPI. Dies ergibt typischerweise Dateien unter 2 MB für ein 10–20-seitiges Dokument.

Für webgehostete Dokumente, die zur Bildschirmlektüre bestimmt sind, gelten ähnliche Einstellungen, ergänzt um die Linearisierung für die schnelle Web-Ansicht. Wenn die PDF auf Mobilgeräten angezeigt wird, ist ein aggressiveres Downsampling der Bilder auf 96–120 DPI akzeptabel, da Mobilbildschirme selten eine effektive DPI von 150 bei typischen Betrachtungsabständen überschreiten.

Für Dokumente, die für den professionellen Druck bestimmt sind, behalten Sie die volle Bildauflösung bei (300 DPI für Fotografien, 1200 DPI für Strichzeichnungen) und verwenden Sie minimale JPEG-Komprimierung (Qualität 85–95) oder verlustfreie Komprimierung. Für Archivdokumente nach PDF/A-Standards verwenden Sie nur die Komprimierungsmethoden, die vom angestrebten PDF/A-Konformitätsniveau erlaubt sind. PDF/A-1 verbietet JPEG2000 und LZW, während PDF/A-2 und PDF/A-3 JPEG2000 erlauben.

Als allgemeine Regel gilt: Komprimieren Sie einmal und so spät wie möglich. Wiederholtes Komprimieren und Dekomprimieren von JPEG-Bildern verursacht generationsbedingte Qualitätsverluste, bei denen sich Artefakte mit jedem Zyklus verstärken. Bewahren Sie Ihre Master-Dokumente in voller Qualität auf und erstellen Sie komprimierte Versionen für spezifische Verteilungskanäle.