PDF を圧縮するとサイズは小さくなりますが、「小さく」なります。内部で起こっているさまざまな出来事をカバーします。実際に何が変更されるかは、ファイルの内容と適用される圧縮の種類によって異なります。これを理解すると、出力がどのようになるかを予測するのに役立ちます。また、同じ圧縮設定が異なるドキュメントで劇的に異なる結果を生成する理由も説明されます。

A PDF は 1 つのファイルに複数の種類のデータが含まれています
圧縮の仕組みについて説明する前に、PDF の内容を知っておくと役立ちます。一般的なドキュメントには、ベクトル グラフィックス (図形、線、数学的に描かれたグラフ)、ラスター イメージ (写真、スキャンしたページ、スクリーンショット)、フォント データを含むテキスト、ドキュメントのメタデータ (作成者、作成日、タイトル)、および構造情報 (ページ レイアウト、ブックマーク、リンク) の組み合わせが含まれています。これらはそれぞれ異なる方法で保存され、圧縮に対する反応も異なります。
PDF を圧縮してみる
インストールは必要ありません。ブラウザで直接動作します。
画像はどうなるか
画像は PDF のファイル サイズの大部分を占める場所であり、圧縮が最も劇的な効果をもたらす場所です。 PDF を圧縮すると、ツールはより積極的な圧縮アルゴリズム (通常はカラー画像の場合は JPEG、白黒画像の場合は JBIG2 または CCITT) を使用して埋め込み画像を再エンコードします。これにより、各画像を表すために保存されるデータの量が削減されます。
JPEG 圧縮は不可逆圧縮です。ファイル サイズを小さくするために、一部の画像データが永久に破棄されます。高品質設定 (80 ~ 90%) では、破棄されるデータは、人間の目が最も敏感でない画像領域 (細かいテクスチャ、微妙な色のグラデーション、高周波の詳細) にあります。結果は基本的に同じに見えます。低品質設定では、破棄されたデータがブロック状、ぼやけ、またはカラー バンディング (典型的な JPEG アーティファクト) として表示されます。
ダウンサンプリングは、一部の圧縮ツールが適用する関連ステップです。画像のピクセル寸法が小さくなり、300 DPI の画像が 150 DPI になる可能性があります。これにより、ファイルが大幅に小さくなりますが、印刷またはズームすると画像が柔らかくなります。品質 PDF 圧縮 ツールは、ダウンサンプリングをスキップするか、オプションの設定にします。
テキストメッセージはどうなりますか
PDF 内のテキストは、文字の画像としてではなく、位置、スタイル、フォント参照を持つ文字として保存されます。このデータは、Deflate (ZIP ファイルで使用されるのと同じアルゴリズム) などの可逆アルゴリズムを使用して非常に効率的に圧縮されます。可逆圧縮では、データを削除せずにファイル サイズが削減されます。解凍された出力は元のものとビットごとに同一になります。
これは、圧縮された PDF 内のテキストが元のテキストとまったく同じであること、つまり同じ文字、同じ位置、同じフォント レンダリングであることを意味します。圧縮されたドキュメントのテキストはいかなる形でも劣化しません。圧縮された PDF 内のテキストが異なって見える場合、問題はビューアでのフォントのレンダリングであり、圧縮によって変更されたものではありません。
フォントはどうなるか
埋め込みフォントはファイル サイズに大きく影響する可能性があります。 5 つの書体の完全なフォント ファイルを埋め込む PDF には、フォント データだけでも数メガバイトになる場合があります。圧縮ツールは、フォントのサブセット化、つまり文書内で実際に使用されていない文字を埋め込みフォントから削除することで、この問題に対処できます。 A ~ Z と 0 ~ 9 の文字のみを使用するドキュメントには、完全な Unicode 文字セットを埋め込む必要はありません。
フォントのサブセット化は、読者の観点からはロスレスです。ドキュメントに表示されるすべての文字がまだ存在しているため、ドキュメントは引き続き正しくレンダリングされます。節約できる量は、元のフォントが埋め込まれている文字数と実際に使用される文字数によって異なります。
完全に削除されるもの
圧縮ツールは、既存のデータを圧縮するだけでなく、時間の経過とともに PDF 内に蓄積されるオーバーヘッドも除去します。 PDF が編集および保存されるたびに、編集された要素の前のバージョンは削除されずにファイル構造に保持されることがよくあります。これが、PDF エディター内での取り消し履歴とバージョンの回復の仕組みです。編集と保存を何度も繰り返したドキュメントには、古いバージョンのオブジェクト、重複データ、実際にはファイルから削除されていない削除されたコンテンツなど、多くの重みが含まれている可能性があります。
圧縮するとこれが解消されます。このツールはファイル構造を最初から再構築し、各要素の現在の状態のみを保持し、蓄積された履歴を破棄します。これが、新しく圧縮された PDF が予想より大幅に小さくなる場合がある理由です。ファイルには、以前の編集による隠れた大幅な肥大化が含まれていました。
変わらないもの
圧縮によってドキュメントのコンテンツ、レイアウト、構造は変更されません。ページ数、ページ順序、テキスト コンテンツ、ベクター グラフィックス、ブックマーク、ハイパーリンク、フォーム フィールドはすべてそのまま残ります。圧縮された PDF は、あらゆる実用的な目的において、オリジナルと同じように開き、表示し、動作します。
設定に応じて変更される可能性があるのは、高ズーム レベルでの画像の鮮明さとファイルのメタデータです。一部の圧縮ツールでは、メタデータを削除または更新します。これは通常は問題ありませんが、元の作成日や作成者フィールドがレコードにとって重要かどうかを知っておく価値があります。
PDF を圧縮してみる
インストールは必要ありません。ブラウザで直接動作します。
