Tips & Tricks

デスクトップ ソフトウェアを使用せずに PDF ファイルをバッチ処理する方法

多数の PDF ファイルを一度に処理する (スキャンした 50 枚の文書を圧縮する、1 か月分の請求書を結合する、PDF フォルダーを Word に変換するなど) には、デスクトップ ソフトウェアは必要ありません。ブラウザベースのツールは、ほとんどの一般的な操作でバッチ処理が実用的なレベルまで改善されており、いくつかのアプローチにより、一度に 1 つずつファイルを処理するよりも大幅に高速化されています。

How to Batch Process PDF Files Without Desktop Software

PDFs にとって「バッチ処理」が実際に意味するもの

バッチ処理は、いくつかの異なるシナリオをカバーします。 1 つ目は、同じ操作を多くのファイルに適用し、同じ設定で 30 の PDF を圧縮することです。 2 つ目は、多くのファイルを 1 つに結合することです。つまり、12 の月次レポートを 1 つの年次文書に統合します。 3 つ目は、1 つの大きなファイルを複数のファイルに分割し、結合されたスキャンを個々のレコードに分割することです。それぞれのツール要件はわずかに異なります。

WukongPDF

PDF を圧縮してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →

バッチ圧縮: 複数のファイルのアップロード

WukongPDF の PDF Compression ツールは、複数のファイルのアップロードを受け入れます。圧縮したいすべての PDF を一度に選択し、まとめてアップロードし、圧縮バージョンをダウンロードします。これは、ファイルを 1 つずつ処理するよりも大幅に高速です。同じ圧縮設定がアップロードされたすべてのファイルに適用されるため、バッチ全体で均一な処理が必要な場合に最適です。

圧縮の場合、ほとんどの場合、バッチ アプローチが適切です。通常は、すべてのファイルをサイズしきい値以下にするか、一貫した品質レベルにしようとし、すべてのファイルに対して同じ設定が機能します。例外は、大幅に異なる処理が必要なファイルであり、個別に処理する必要があります。

バッチ結合: 多数を 1 つに結合

複数のファイルのアップロードを受け入れる結合ツールを使用すると、1 回の操作で必要な数の PDF を結合できます。ファイルをアップロードし、正しい順序に並べて、結合された結果をダウンロードします。月次レポートの作成、年末の請求書の同梱、または別のソースからのドキュメント パッケージの組み立ての場合、これがワークフローです。

実践的なヒントの 1 つ: アップロードする前にファイルに先頭の数字を付けて名前を付けます (01_April.pdf、02_April.pdf)。これにより、ツールでファイルがリストに表示されるときに、ファイルがすでに正しい順序で表示されます。これにより、特に大規模なバッチの場合、ファイルを手動でシーケンスにドラッグする時間が節約されます。

バッチ OCR: 多くのスキャンを検索可能にする

紙のアーカイブをデジタル化している組織にとって、スキャンされた多数の PDF に対して OCR を実行することは一般的なニーズです。 OCR 用に複数のアップロードを受け入れるブラウザ ツールは、スキャンされたファイルのバッチを処理し、検索可能な PDF を返すことができます。非常に大容量のファイル (数千のファイル) の場合は、ブラウザ ツールが限界に達し、デスクトップ ソフトウェアまたはクラウド ベースの自動化がより実用的になります。

中程度の量(数十から数百前半)の場合は、ブラウザベースのバッチ OCR が機能します。ファイルをツールのアップロード制限内に収まるグループに分割し、各グループを処理して結果を収集します。これは自動パイプラインよりも手動ですが、ソフトウェアのインストールや技術的なセットアップは必要ありません。

ブラウザ ツールが限界に達したとき

ブラウザ ツールは、最大数十のファイルのバッチに適しています。数百または数千のファイルがある場合、またはスケジュールに従って実行する必要があるワークフローの場合は、desktop automation または API ベースのソリューションがより適切です。 PyPDF2 または pdfrw を備えた Python などのツールは、手動でアップロードせずに、ファイルのフォルダー全体をプログラムで処理できます。

大量のデータを扱う非技術ユーザー向けに、Adobe Acrobat Pro のアクション ウィザードは、ファイルのフォルダーに対して自動的に実行されるバッチ処理ワークフローを作成します。これは、小規模なバッチではブラウザ ツールが大規模に実行するものに最も似たデスクトップ ツールです。

バッチ処理からの出力の整理

バッチ処理の結果をダウンロードする場合、通常、出力ファイルは個別にダウンロードされるか、ZIP アーカイブとしてダウンロードされます。ダウンロードする前に宛先フォルダーを設定します。複数のバッチ ジョブの出力が含まれるダウンロード フォルダーを分類するよりも、ファイルを適切な場所にすぐに移動する方がはるかに簡単です。圧縮ファイルの場合は、圧縮バージョンが正しいかどうかを確認するまで、元のファイルを保管しておいてください。満足したらオリジナルを削除してください。

WukongPDF

PDF を圧縮してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →