Others

スキャンした PDF が非常に大きいのはなぜですか?

5 ページの手紙をスキャンした PDF は 80MB であってはなりません。しかし、そうなることはよくあり、その理由はほとんどの場合、ドキュメント自体に関するものではなく、スキャンの設定方法にあります。スキャンされた PDF のファイル サイズは、ページ上のテキストの量とは関係がありません。スキャナーがキャプチャした画像データによって完全に決まります。この違いを理解することは、修正に直接関係します。

Why Is My Scanned PDF So Large?

スキャナーの解像度の設定が高すぎました

これは、スキャンされた PDF のサイズがはるかに大きくなる最も一般的な原因です。スキャナの解像度は DPI (ドット/インチ) で測定されます。 DPI が高いほど、より多くの画像データがキャプチャされ、結果として得られるファイルは大きくなります。多くのスキャナーはデフォルトで 300 または 600 DPI に設定されており、大きなフォーマットで印刷したり、詳細に拡大したりする必要があるドキュメントをアーカイブするのに適しています。電子メールで共有したり、ポータルにアップロードしたりする標準的なテキスト ドキュメントの場合、これはやりすぎです。

300 DPI では、A4 のカラー 1 ページで、圧縮前の生の画像データが約 25 MB 生成されます。これに 10 ページのドキュメントを掛けると、PDF が保存されるまでに 250 MB から開始することになります。ほとんどのスキャナーは自動的に圧縮を適用しますが、それでも開始点は大量のデータです。

テキストのみのドキュメントの場合、きれいで読みやすい出力には 150 DPI で十分です。写真や詳細な図を含むドキュメントの場合、共有目的では 200 DPI が妥当な上限です。後でドキュメントを完全な品質で複製する必要がある場合の本格的なアーカイブのニーズに備えて、300 DPI 以上を節約します。

WukongPDF

PDF を圧縮してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →

グレースケールまたは白黒の代わりにカラー スキャン

カラー スキャンでは、ピクセルごとに 3 チャネルのデータ (赤、緑、青の値) が保存されます。グレースケール スキャンでは 1 つだけが保存されます。白黒 (モノクロ) スキャンでは、ピクセルごとに 1 ビット、つまり黒か白のいずれかが保存され、その間には何も保存されません。ファイル サイズの違いは大きく、プレーン テキスト ドキュメントをカラー スキャンすると、同じドキュメントを白黒でスキャンした場合よりも 10 ~ 20 倍大きくなることがあります。

文書が白い紙に黒のインクで書かれている場合 (ほとんどのビジネス文書、契約書、フォームなど)、カラーでスキャンするメリットはありません。スキャンでは、紙のわずかなクリーム色、ステープル穴の近くの灰色の影、インク濃度の微妙な変化がキャプチャされますが、どれも必要ありません。スキャナーの設定で白黒またはグレースケール モードに切り替えると、ファイル サイズが大幅に削減されます。

保存時に圧縮は適用されませんでした

一部のスキャナ ソフトウェアは、スキャンした画像を最小限の圧縮または圧縮なしで保存します。スキャナーは生の画像データをキャプチャし、それをほぼそのままの状態で PDF に書き込むため、その内容に対して不必要に大きなファイルが作成されます。これはスキャナーやソフトウェアによって異なります。デフォルトで強力な圧縮を適用するものもあれば、ほとんど圧縮しないものもあります。

サイズが大きいスキャン済み PDF がすでにある場合は、PDF Compression ツールを使用してそれを実行することが、多くの場合最も早い修正です。スキャンされた PDF に適切な圧縮ツールを適用すると、品質に目に見える変化を与えることなく、ファイル サイズを 60 ~ 80% 削減できます。特に、画像データが非常に効率的に圧縮される白黒のテキスト ドキュメントの場合に当てはまります。

スキャンに不要なページまたは空白ページが含まれている

自動ドキュメント フィーダを備えたスキャナでは、特にドキュメントの裏面が空の場合、余分な白紙ページが取り込まれることがあります。各空白ページは引き続き PDF に完全な画像として保存されるため、有用なコンテンツが追加されずにファイル サイズが大きくなります。 6 つの偶然の空白ページを含む 20 ページのスキャンは、必要なサイズより 30% 大きくなります。

スキャン後、PDF をすぐに確認し、保存または共有する前に空白のページや重複したページを削除してください。ほとんどの PDF ツールでは、個々のページを削除できます。これには約 30 秒かかり、最終的なサイズを大幅に削減できます。

既存のスキャンされた PDF のサイズを削減する方法__

スキャンがすでに完了しており、ファイルが大きすぎる場合は、主に 2 つのオプションがあります。圧縮するか、より適切な設定で再スキャンします。物理ドキュメントにまだアクセスでき、可能な限り最良の結果が必要な場合は、再スキャンがよりクリーンな解決策です。ただし、ファイルをすぐにサイズ制限以下にする必要がある場合は、圧縮が適切に機能します。

WukongPDF の PDF Compression ツールは、埋め込み画像を直接最適化するため、スキャンされた PDF を適切に処理します。これがまさにスキャンされた PDF の構成要素です。ファイルをアップロードし、圧縮レベルを選択して、結果をダウンロードします。一般的なスキャンされたテキスト文書の場合、出力は通常、目に見える品質の低下がなく、元の文書より 70 ~ 85% 小さくなります。

今後使用するスキャン設定

スキャナーの設定をいくつか変更すると、最初からファイルを管理しやすくなります。

  • テキストのみのドキュメント: 白黒モード、150 DPI
  • 写真またはグラフィックを含むドキュメント: グレースケールまたはカラー、200 DPI
  • 複製する必要があるオリジナルのアーカイブ: 300 DPI、該当する場合はカラー
  • オプションが利用可能な場合は、スキャナ ソフトウェアで PDF 圧縮を常に有効にしてください

スキャンされた PDF は大容量である必要はありません。スキャン時に適切な設定を行うと、実際に必要な品質を損なうことなくファイルのサイズが小さく保たれます。また、圧縮パスで漏れたものは事後に処理されます。

WukongPDF

PDF を圧縮してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →