Zurück zu allen Ratgebern

So optimieren Sie PDFs für E-Mail und Web-Verteilung

Praktische Techniken zur Reduzierung der PDF-Dateigröße ohne Qualitätseinbußen, einschließlich Bildkomprimierung, Schriftarten-Subsetting und Web-Optimierung.

Matthias Baertschi
Founder & Lead Engineer
8 min

Warum die PDF-Dateigröße bei der Verteilung wichtig ist

Die PDF-Dateigröße wirkt sich direkt darauf aus, wie effektiv Sie Dokumente per E-Mail und im Web teilen können. Die meisten E-Mail-Anbieter begrenzen Anhänge: Gmail auf 25 MB, Outlook auf 20 MB, und viele Unternehmens-Mailserver setzen noch niedrigere Grenzen von 10 MB. Wenn eine PDF diese Grenzen überschreitet, muss der Absender auf Filesharing-Dienste zurückgreifen, was den Kommunikationsprozess erschwert und beim Empfänger Sicherheitsbedenken aufwerfen kann.

Im Web beeinflusst die Dateigröße die Ladezeit, was wiederum die Benutzerinteraktion und Suchmaschinen-Rankings beeinflusst. Google hat wiederholt bestätigt, dass die Seitengeschwindigkeit ein Ranking-Faktor ist, und dies gilt auch für PDF-Dokumente, die von Webseiten verlinkt werden. Eine Studie von Google ergab, dass bei einer Erhöhung der Ladezeit von 1 auf 3 Sekunden die Wahrscheinlichkeit eines Seitenabsprungs um 32 % steigt. Bei PDFs, die in Webseiten eingebettet oder als Downloads bereitgestellt werden, zählt jedes Megabyte.

Über technische Grenzen hinaus schaffen große PDFs eine schlechte Benutzererfahrung auf Mobilgeräten. Nutzer mit Mobilfunkverbindungen haben möglicherweise begrenzte Datentarife, und das Herunterladen einer 50-MB-PDF über eine 3G-Verbindung kann mehrere Minuten dauern. Die Optimierung von PDFs hinsichtlich der Größe stellt sicher, dass Ihre Dokumente für die breitestmögliche Zielgruppe zugänglich sind, unabhängig von Verbindungsgeschwindigkeit, E-Mail-Anbieter oder Gerätefähigkeiten.

Was PDFs groß macht – die Ursachen verstehen

Um die PDF-Größe effektiv zu reduzieren, müssen Sie verstehen, was zur Aufblähung beiträgt. Der größte Verursacher sind fast immer Bilder. Ein einzelnes hochauflösendes Foto, das mit 300 DPI in Vollfarbe eingebettet ist, kann mehrere Megabyte beanspruchen. PDFs, die aus gescannten Dokumenten erstellt wurden, sind im Wesentlichen Sammlungen großer Bilder und können bei mehrseitigen Dokumenten leicht Hunderte von Megabyte erreichen.

Schriftarten sind der zweitgrößte Verursacher. Wenn eine PDF eine vollständige Schriftdatei einbettet, enthält sie jedes Zeichen der Schriftart, auch diejenigen, die im Dokument nicht verwendet werden. Eine einzelne OpenType-Schrift kann 500 KB oder mehr umfassen, und Dokumente, die mehrere Schriftfamilien verwenden, können allein mehrere Megabyte an Schriftdaten ansammeln. Schriftarten-Subsetting, bei dem nur die tatsächlich verwendeten Zeichen einbezogen werden, kann dies drastisch reduzieren.

Weitere Verursacher sind eingebettete Multimedia-Inhalte (Audio, Video, 3D-Modelle), Formularfelddaten, JavaScript, Dokumentmetadaten, Miniaturbilder und die Dokumentstruktur selbst. PDFs, die wiederholt bearbeitet wurden, können verwaiste Objekte, inkrementelle Speicherdaten aus früheren Versionen und doppelte Ressourcen enthalten. Eine PDF, die viele Bearbeitungsrunden durchlaufen hat, kann deutlich größer sein als eine frisch erstellte mit demselben Inhalt, einfach aufgrund des angesammelten Overheads durch den Bearbeitungsprozess.

Strategien zur Bildkomprimierung

Da Bilder der Haupttreiber der PDF-Dateigröße sind, bietet die Bildkomprimierung das größte Reduzierungspotenzial. PDF unterstützt verschiedene Bildkomprimierungsmethoden: JPEG (verlustbehaftet), JPEG2000 (verlustbehaftet und verlustfrei), Flate/ZIP (verlustfrei), CCITT (für Schwarzweiß-Bilder) und JBIG2 (für Schwarzweiß, mit optionalem verlustbehaftetem Modus). Die Wahl der Komprimierungsmethode hängt vom Bildinhalt und dem akzeptablen Qualitätskompromiss ab.

Für fotografische Inhalte erzeugt die JPEG-Komprimierung bei einer Qualitätseinstellung von 60–75 % typischerweise Dateien, die bei normaler Betrachtungsentfernung visuell nicht vom Original zu unterscheiden sind, während die Größe im Vergleich zu unkomprimierten Bildern um 80–90 % reduziert wird. Wenn die PDF für die Bildschirmansicht und nicht für den Druck bestimmt ist, halbiert eine Reduzierung der Bildauflösung auf 150 DPI (von den üblichen 300 DPI) die Pixelanzahl in jeder Dimension und reduziert die Bilddaten um etwa 75 %.

Für Dokumente, die hauptsächlich Text und Strichzeichnungen enthalten (wie gescannte Dokumente nach OCR), ist die Schwarzweiß-Komprimierung mit CCITT Group 4 oder JBIG2 weitaus effizienter als JPEG. Die Umwandlung eines Farbscans in Schwarzweiß und die Anwendung der CCITT-Komprimierung kann eine 5-MB-Seite auf unter 50 KB reduzieren. Für Seiten mit gemischten Inhalten, die sowohl Fotos als auch Text enthalten, können einige Tools die Seite segmentieren und unterschiedliche Komprimierungen auf verschiedene Bereiche anwenden – JPEG für fotografische Bereiche und CCITT für Textbereiche.

Schriftarten-Optimierung und Subsetting

Schriftarten-Subsetting ist der Prozess der Entfernung nicht verwendeter Zeichen aus eingebetteten Schriftarten. Wenn Ihr Dokument das Wort "Hallo" in Arial verwendet, benötigt es nur die Zeichen für H, a, l und o – nicht den gesamten Arial-Zeichensatz mit über 3.000 Zeichen. Die meisten PDF-Erstellungstools führen das Subsetting automatisch durch, aber Dokumente, die in bestimmten Anwendungen bearbeitet wurden, können vollständige Schrifteinbettungen ansammeln.

Um die Schriftverwendung in einer PDF zu überprüfen, untersuchen Sie die Dokumenteigenschaften in Adobe Acrobat oder verwenden Sie ein Kommandozeilen-Tool wie pdffonts (Teil der Poppler-Dienstprogramme). Dieses zeigt jede Schrift an, ob sie eingebettet oder als Subset eingebettet ist, und die verwendete Kodierung. Suchen Sie nach Schriften, die als "Eingebettet" statt "Eingebettetes Subset" gekennzeichnet sind, als Kandidaten für die Optimierung.

Eine weitere Technik zur Schriftoptimierung ist die Umwandlung von Text in Pfade (Vektorkurven) für Dokumente, die keine Textextraktion oder Durchsuchbarkeit benötigen. Dies eliminiert die Schrifteinbettung vollständig und ersetzt jedes Zeichen durch seine geometrische Darstellung. Allerdings erhöht dies die Dateigröße bei textlastigen Dokumenten, da Vektorpfade mehr Daten erfordern als Schriftreferenzen für große Textmengen. Es ist am nützlichsten für Dokumente mit wenig Text, wie Design-Dateien oder Logos. Für Dokumente, bei denen die Durchsuchbarkeit wichtig ist, sollten Schriften eingebettet und als Subset beibehalten werden, anstatt sie in Pfade umzuwandeln.

Linearisierung: Schnelle Web-Ansicht

Linearisierung, auch bekannt als "Schnelle Web-Ansicht" oder "Web-Optimierung", strukturiert eine PDF so um, dass die erste Seite angezeigt werden kann, bevor die gesamte Datei heruntergeladen wurde. In einer nicht-linearisierten PDF befindet sich die Querverweistabelle, die Objektpositionen zuordnet, am Ende der Datei. Ein Webbrowser muss die gesamte Datei herunterladen, bevor er eine Seite finden und rendern kann. In einer linearisierten PDF werden die Querverweisdaten für die erste Seite zusammen mit allen zum Rendern dieser ersten Seite benötigten Objekten an den Anfang gestellt.

Diese Umstrukturierung hat keinen Einfluss auf die Dateigröße, verbessert aber die wahrgenommene Leistung für webgehostete PDFs erheblich. Wenn ein Benutzer auf einen Link zu einer linearisierten PDF klickt, kann sein Browser fast sofort mit dem Rendern der ersten Seite beginnen, während der Rest der Datei im Hintergrund weiter heruntergeladen wird. Bei einem 10-MB-Dokument bedeutet dies, dass der Benutzer innerhalb von Sekunden Inhalte sieht, anstatt auf den vollständigen Download zu warten.

Linearisierung ist besonders wichtig für PDFs, die von Webservern bereitgestellt werden, die HTTP-Byte-Range-Anfragen unterstützen. Mit Byte-Range-Unterstützung kann ein PDF-Viewer bestimmte Abschnitte der Datei anfordern, sodass Benutzer zu jeder beliebigen Seite springen können, ohne das gesamte Dokument herunterzuladen. Adobe Acrobats "Speichern unter"-Option enthält eine Einstellung für "Schnelle Web-Ansicht". Kommandozeilen-Tools wie QPDF können bestehende PDFs linearisieren. Wenn Sie regelmäßig PDFs auf einer Website veröffentlichen, integrieren Sie die Linearisierung in Ihren Veröffentlichungs-Workflow.

Unnötige PDF-Elemente entfernen

PDFs enthalten oft Elemente, die zur Dateigröße beitragen, ohne dem Endleser einen Mehrwert zu bieten. Das Entfernen dieser Elemente kann die Größe spürbar reduzieren. Beginnen Sie mit den Metadaten: PDF-Dokumente können umfangreiche XMP-Metadaten, benutzerdefinierte Eigenschaften, Dokumentversionsverläufe und eingebettete Miniaturbilder enthalten. Obwohl Metadaten für die Dokumentenverwaltung nützlich sind, sind sie für die Verteilung oft unnötig und können der Dateigröße einige zehn Kilobyte hinzufügen.

Formularfelder, JavaScript und interaktive Elemente erzeugen Overhead. Wenn ein ausfüllbares PDF-Formular ausgefüllt wurde und der Empfänger die Antworten nicht bearbeiten muss, reduziert das Reduzieren des Formulars (Umwandlung von Formularfeldern in statische Inhalte) die Größe und verhindert versehentliche Änderungen. Ebenso kann JavaScript, das für Formularvalidierung oder dynamische Inhalte verwendet wird, aus der endgültigen Verteilungsversion entfernt werden.

Anmerkungen und Markierungen, die Teil eines Überprüfungsprozesses waren, sollten vor der Verteilung reduziert oder entfernt werden. Jeder Kommentar, jede Hervorhebung oder Haftnotiz ist ein separates PDF-Objekt, das zur Dateigröße beiträgt. Druckproduktionsinformationen wie Farbprofile, Ausgabeabsichten und Druckermarken sind für den kommerziellen Druck wichtig, aber für die E-Mail- und Web-Verteilung unnötig. Allein das Entfernen von ICC-Farbprofilen kann mehrere hundert Kilobyte einsparen. Entfernen Sie schließlich alle eingebetteten Dateien oder Anhänge, die für den Zweck des Dokuments nicht wesentlich sind.

Automatisierte Optimierungs-Workflows

Für Organisationen, die regelmäßig PDFs erstellen und verteilen, ist eine manuelle Optimierung nicht tragbar. Die Einrichtung automatisierter Workflows gewährleistet eine konsistente Qualität und Dateigröße über alle veröffentlichten Dokumente hinweg. Der einfachste Ansatz besteht darin, die PDF-Erstellungseinstellungen in Ihrer Authoring-Anwendung zu konfigurieren. In Microsoft Word ermöglichen die PDF-Exportoptionen das Festlegen der Bildauflösung, Schrifteinbettung und ob nicht-druckbare Informationen einbezogen werden sollen. Wenn Sie diese beim Erstellen korrekt einstellen, entfällt die Notwendigkeit einer nachträglichen Optimierung.

Für die Nachbearbeitung bieten Tools wie Ghostscript eine kommandozeilenbasierte PDF-Optimierung, die in Skripte und Build-Systeme integriert werden kann. Ghostscripts PDF-Ausgabemodi (Bildschirm, E-Book, Drucker, Druckvorstufe) wenden progressiv weniger aggressive Komprimierung an, sodass Sie leicht die richtige Balance für Ihren Anwendungsfall wählen können. Die "E-Book"-Einstellung, die auf 150-DPI-Bilder und Standard-Schrift-Subsetting abzielt, ist ein guter Standard für die E-Mail- und Web-Verteilung.

Browserbasierte PDF-Tools bieten eine Optimierung ohne Softwareinstallation. Die clientseitige Verarbeitung stellt sicher, dass sensible Dokumente Ihr Gerät niemals verlassen. Für Teamumgebungen sollten Sie PDF-Größenrichtlinien festlegen (z. B. unter 5 MB für E-Mail-Anhänge, unter 2 MB für Web-Downloads) und Teammitgliedern leicht verständliche Optimierungsverfahren bereitstellen. Dokumentvorlagen sollten mit optimierten Einstellungen vorkonfiguriert sein, damit die Standardausgabe bereits für die Verteilung geeignet ist.

Optimierungsergebnisse messen und validieren

Validieren Sie nach der Optimierung einer PDF, dass die gewünschte Größenreduzierung ohne inakzeptablen Qualitätsverlust erreicht wurde. Vergleichen Sie die optimierte Dateigröße mit Ihren Zielvorgaben. Eine gut optimierte PDF eines typischen 10-seitigen Geschäftsdokuments mit einigen Bildern sollte unter 2 MB liegen. Reine Textdokumente sollten deutlich unter 500 KB liegen.

Die visuelle Qualität sollte bei der beabsichtigten Anzeigegröße überprüft werden. Wenn die PDF auf dem Bildschirm betrachtet wird, zoomen Sie auf 100 % und prüfen Sie Bilder und Text auf Artefakte. JPEG-Komprimierungsartefakte sind am sichtbarsten in Bereichen mit Vollfarbe neben detaillierten Bereichen und in Text, der als Bild gerendert wird. Wenn die PDF gedruckt werden könnte, zoomen Sie auf 200–300 %, um Qualitätsprobleme zu erkennen, die im Druck sichtbar wären.

Überprüfen Sie, dass Text nach der Optimierung weiterhin auswählbar und durchsuchbar bleibt. Einige aggressive Optimierungstools können versehentlich Text in Bilder umwandeln. Prüfen Sie, ob Hyperlinks, Lesezeichen und das Inhaltsverzeichnis weiterhin korrekt funktionieren. Führen Sie bei barrierefreien Dokumenten eine Barrierefreiheitsprüfung durch, um sicherzustellen, dass Tags, Lesereihenfolge und Alternativtexte den Optimierungsprozess überstanden haben. Bewahren Sie eine Kopie der ursprünglichen, nicht optimierten Datei auf, falls Sie mit anderen Einstellungen erneut optimieren oder später hochwertige Bilder extrahieren müssen.

Matthias Baertschi
Founder & Lead Engineer

Matthias ist Gründer und Lead Engineer von PDF Tools und arbeitet an der In-Browser-Pipeline für die PDF-Verarbeitung mit pdf-lib und pdfjs-dist. Sein Fokus liegt auf clientseitigem Datenschutz: Dokumente werden lokal verarbeitet und nie an einen Server hochgeladen. Autorenprofil ansehen