Others

Was passiert mit einem PDF, wenn Sie es komprimieren?

Durch das Komprimieren eines PDF wird es kleiner, aber „kleiner“ deckt eine Reihe von Dingen ab, die unter der Haube passieren. Was tatsächlich geändert wird, hängt davon ab, was die Datei enthält und welche Art von Komprimierung angewendet wird. Wenn Sie dies verstehen, können Sie vorhersagen, wie die Ausgabe aussehen wird – und erklären, warum dieselbe Komprimierungseinstellung bei verschiedenen Dokumenten zu völlig unterschiedlichen Ergebnissen führt.

What Happens to a PDF When You Compress It?

A PDF besteht aus mehreren Datentypen in einer Datei

Bevor wir uns mit der Funktion der Komprimierung befassen, ist es hilfreich zu wissen, was in einem PDF enthalten ist. Ein typisches Dokument enthält eine Kombination aus: Vektorgrafiken (Formen, Linien, mathematisch gezeichnete Diagramme), Rasterbildern (Fotos, gescannte Seiten, Screenshots), Text mit Schriftartdaten, Dokumentmetadaten (Autor, Erstellungsdatum, Titel) und Strukturinformationen (Seitenlayout, Lesezeichen, Links). Jedes davon wird anders gespeichert und reagiert unterschiedlich auf die Komprimierung.

WukongPDF

Versuchen Sie, PDF zu komprimieren

Keine Installation erforderlich. Funktioniert direkt in Ihrem Browser.

Jetzt starten →

Was passiert mit Bildern

Der größte Teil der Dateigröße einer PDF-Datei liegt in Bildern, und dort hat die Komprimierung den größten Effekt. Wenn Sie ein PDF komprimieren, kodiert das Tool eingebettete Bilder mit einem aggressiveren Komprimierungsalgorithmus neu – normalerweise JPEG für Farbbilder, JBIG2 oder CCITT für Schwarzweißbilder. Dadurch wird die Datenmenge reduziert, die zur Darstellung jedes Bildes gespeichert wird.

Die JPEG-Komprimierung ist verlustbehaftet – einige Bilddaten werden dauerhaft verworfen, um kleinere Dateigrößen zu erreichen. Bei hohen Qualitätseinstellungen (80–90 %) liegen die verworfenen Daten in Bereichen des Bildes, in denen das menschliche Auge am wenigsten empfindlich ist: feine Textur, subtile Farbverläufe, hochfrequente Details. Das Ergebnis sieht im Wesentlichen identisch aus. Bei niedrigeren Qualitätseinstellungen werden die verworfenen Daten als Blockbildung, Unschärfe oder Farbstreifen sichtbar – die klassischen JPEG-Artefakte.

Downsampling ist ein verwandter Schritt, den einige Komprimierungstools anwenden. Es reduziert die Pixelabmessungen von Bildern – ein 300-DPI-Bild kann zu 150 DPI werden –, wodurch die Dateien viel kleiner werden, die Bilder aber auch weicher werden, wenn sie gedruckt oder gezoomt werden. Qualität PDF Komprimierung Tools überspringen entweder das Downsampling oder machen es zu einer optionalen Einstellung.

Was passiert mit Text

Text in einem PDF wird als Zeichen mit Positionen, Stilen und Schriftartreferenzen gespeichert – nicht als Bilder von Buchstaben. Diese Daten werden mithilfe verlustfreier Algorithmen wie Deflate (dem gleichen Algorithmus, der auch in ZIP-Dateien verwendet wird) sehr effizient komprimiert. Die verlustfreie Komprimierung reduziert die Dateigröße, ohne Daten zu entfernen: Die dekomprimierte Ausgabe ist Bit für Bit identisch mit dem Original.

Das bedeutet, dass der Text in einem komprimierten PDF genau derselbe ist wie im Original – dieselben Zeichen, dieselben Positionen, dieselbe Schriftartwiedergabe. Der Text eines komprimierten Dokuments wird in keiner Weise beeinträchtigt. Wenn Text in einem komprimierten PDF anders aussieht, liegt das Problem an der Schriftartwiedergabe im Viewer und nicht an den Änderungen durch die Komprimierung.

Was passiert mit Schriftarten

Eingebettete Schriftarten können erheblich zur Dateigröße beitragen. Ein PDF, das vollständige Schriftartdateien für fünf Schriftarten einbettet, kann allein mehrere Megabyte an Schriftartdaten enthalten. Komprimierungstools können dieses Problem durch die Unterteilung von Schriftarten beheben, indem sie alle Zeichen aus der eingebetteten Schriftart entfernen, die im Dokument nicht tatsächlich verwendet werden. In einem Dokument, das nur die Buchstaben A-Z und 0-9 verwendet, muss nicht der vollständige Unicode-Zeichensatz eingebettet sein.

Aus der Sicht des Lesers ist die Unterteilung von Schriftarten verlustfrei – das Dokument wird immer noch korrekt gerendert, da alle darin vorkommenden Zeichen noch vorhanden sind. Die Einsparungen hängen davon ab, wie viele Zeichen in der ursprünglichen Schriftart eingebettet sind und wie viele tatsächlich verwendet werden.

Was vollständig entfernt wird

Über die Komprimierung vorhandener Daten hinaus beseitigen Komprimierungstools auch den Overhead, der sich im Laufe der Zeit in PDFs ansammelt. Jedes Mal, wenn ein PDF bearbeitet und gespeichert wird, bleibt die vorherige Version der bearbeiteten Elemente häufig in der Dateistruktur erhalten und wird nicht gelöscht – so funktionieren das Rückgängigmachen des Verlaufs und die Versionswiederherstellung in PDF-Editoren. Ein Dokument, das viele Bearbeitungs- und Speicherzyklen durchlaufen hat, kann viel Eigengewicht mit sich bringen: alte Versionen von Objekten, doppelte Daten, gelöschte Inhalte, die nie wirklich aus der Datei entfernt wurden.

Durch die Komprimierung wird dies beseitigt. Das Tool baut die Dateistruktur von Grund auf neu auf, behält dabei nur den aktuellen Status jedes Elements bei und verwirft den angesammelten Verlauf. Aus diesem Grund sind frisch komprimierte PDFs manchmal erheblich kleiner als erwartet – die Datei enthielt erhebliche versteckte Aufblähungen aus früheren Bearbeitungen.

Was genau gleich bleibt

Durch die Komprimierung werden Inhalt, Layout und Struktur des Dokuments nicht verändert. Seitenzahl, Seitenreihenfolge, Textinhalt, Vektorgrafiken, Lesezeichen, Hyperlinks und Formularfelder bleiben alle erhalten. Das komprimierte PDF wird aus praktischen Gründen genauso geöffnet, angezeigt und verhält sich wie das Original.

Was sich – abhängig von den Einstellungen – ändern kann, ist die Bildschärfe bei hohen Zoomstufen und die Metadaten der Datei. Einige Komprimierungstools entfernen oder aktualisieren Metadaten, was normalerweise in Ordnung ist, aber es lohnt sich zu wissen, ob das ursprüngliche Erstellungsdatum oder das ursprüngliche Autorenfeld für Ihre Datensätze von Bedeutung ist.

WukongPDF

Versuchen Sie, PDF zu komprimieren

Keine Installation erforderlich. Funktioniert direkt in Ihrem Browser.

Jetzt starten →