Others

PDF 圧縮: 非可逆圧縮と可逆圧縮 — 違いは何ですか?

PDF を圧縮するとき、このツールは、処理するコンテンツの種類に応じて、根本的に異なる 2 つのアプローチのいずれかを適用します。非可逆圧縮と可逆圧縮は単に設定が異なるだけではなく、異なる効果と異なるトレードオフを持つ異なる操作です。この違いを理解すると、テキスト文書の圧縮と写真の多いパンフレットの圧縮でこれほど異なる結果が得られる理由がわかります。

PDF Compression: Lossy vs Lossless — What's the Difference?

ロスレス圧縮: 何も削除せずにサイズを小さく

可逆圧縮は、データ内の冗長性、つまり情報を破棄することなくより効率的に記述できるパターンを見つけて排除することにより、ファイル サイズを削減します。解凍された出力は数学的には元の出力と同一です。何も失われたり、変更されたり、近似されたりすることはありません。

簡単なたとえ: 「AAAAAAAAA」と書く代わりに、ファイルに「9×A」と書きます。情報は同じ (9 つの A) ですが、ストレージはより効率的です。実際の圧縮アルゴリズムはより洗練されていますが、原理は同じです。つまり、表現内容を失わずに、より少ないバイトで表現できるパターンを見つけるということです。

PDFs では、可逆圧縮がテキスト、ベクトル グラフィックス、および構造データに適用されます。これが、テキストの多い PDF を圧縮しても目に見える品質の変化が生じない理由です。テキストは可逆圧縮され、すべての文字が完全に保存されます。 PDF 標準では、これらのコンテンツ タイプの可逆圧縮に ZIP/Deflate や LZW などの形式が使用されます。

WukongPDF

PDF の圧縮をお試しください

インストールは必要ありません。ブラウザで直接動作します。

始める →

非可逆圧縮: データの破棄による圧縮

非可逆圧縮は、アルゴリズムが重要度が低いと判断したデータ (通常は人間の認識が鈍い情報) を永久に破棄することで、ファイル サイズを小さくします。画像の場合、これは、滑らかなグラデーションの微妙な色の変化、低コントラスト領域の細かいディテール、知覚されにくい高周波の視覚情報を意味します。

JPEG は、最もよく知られている非可逆圧縮形式です。 JPEG 画像が圧縮される場合、アルゴリズムは画像を 8 × 8 ピクセルのブロックに分割し、各ブロック内の色情報を簡素化します。圧縮レベルが低い場合、単純化は微妙で目に見えません。高い圧縮レベルでは、ブロック境界が特徴的なブロック状の JPEG アーティファクトとして表示されます。

重要なことに、非可逆圧縮は永続的です。一度破棄されたデータは復元できません。 JPEG で高度に圧縮された画像を解凍することはできますが、失われた細部は復元されず、元の画像ではなく近似値が得られます。このため、画像を多く含むドキュメントの PDF 圧縮 は、オリジナルを保持したままコピーに対してのみ実行する必要があります。

PDF が両方のタイプを同時に使用する方法

通常、単一の PDF には複数のコンテンツ タイプが含まれており、圧縮はそれぞれに異なる方法で適用されます。

  • テキストとベクター グラフィックス: 常にロスレス。文字、線、図形をデータを失わずに圧縮します。
  • 写真: 通常、非可逆性 (JPEG)。圧縮レベルによって、どの程度の画像データが破棄されるかが決まります。
  • スクリーンショットとシャープなエッジのあるグラフィックス: 可逆性がある場合 (白黒の場合は ZIP または JBIG2)、PDF 作成ツールと設定によっては非可逆性がある場合があります。
  • ドキュメントの構造とメタデータ: 常にロスレス。 PDF の構造的完全性は正確に保持される必要があります。

これが、PDF 圧縮ツールが、テキストのみの契約書への影響を最小限に抑えながら、スキャンした写真の多いパンフレットのサイズを大幅に削減できる理由です。パンフレットには非可逆圧縮可能な画像データが多数含まれていますが、契約書はほぼ完全に可逆圧縮されたテキストです。

「圧縮レベル」とは実際にコントロール

PDF Tools の圧縮インターフェイスが低、中、高の圧縮設定を提供する場合、画像に適用される非可逆圧縮の積極性が調整されます。可逆圧縮は、設定に関係なく最大の効率で実行されます。唯一意味のある変数は、非可逆画像圧縮でどれだけ品質が犠牲になるかです。

  • 低: 品質損失を最小限に抑えて圧縮された画像 — JPEG 品質 85 ~ 90 と同様
  • 中: 中程度の品質低下を伴って圧縮された画像 — JPEG 品質 70 ~ 80 と同様
  • 高: 画像を積極的に圧縮します。JPEG 品質 50 ~ 60 と同様で、アーティファクトが目立ちます。

ほとんどの日常的な PDF 共有 (電子メールで送信する前にレポートを圧縮する、アップロードするプレゼンテーションを縮小する) では、中程度の圧縮が適切なバランスを与えます。テキストは完全 (ロスレス) のままで、画像は視覚的にきれいなままで、ファイル サイズは問題になるほど小さくなります。 www.wukongpdf.com にある WukongPDF の Reduce PDF Size ツールは、このアプローチを適用しています。ユースケースに合ったレベルを選択し、見栄えを悪くすることなく小さいファイルをダウンロードします。

WukongPDF

PDF の圧縮をお試しください

インストールは必要ありません。ブラウザで直接動作します。

始める →