Others

画像を検索可能な PDF に変換できますか?

画像を検索可能な PDF に変換するのは 2 段階のプロセスです。最初に画像が PDF になり、次に OCR によってテキスト レイヤーが追加され、コンテンツを検索して選択できるようになります。両方の手順は、それをサポートするツールで一緒に実行することも、各段階をより詳細に制御したい場合は個別に実行することもできます。

Can You Convert an Image to a Searchable PDF?

通常の画像 PDF と検索可能な画像 の違い

OCR を使用せずに画像を PDF に変換すると、画像を表示する PDF が得られます。開いたり、拡大したり、印刷したりできますが、テキストの選択、単語の検索、コンテンツのコピーはできません。これは本質的に、PDF コンテナーにラップされた写真です。検索可能な PDF は、画像の下に非表示のテキスト レイヤーを追加します。これは、画像内のテキストを OCR で読み取ることによって作成されます。見た目は変わりませんが、Ctrl+F で単語が検索され、テキストをコピーできるようになりました。

WukongPDF

PDF OCR を試してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →

両方のステップを一度に実行

WukongPDF の OCR PDF ツールは、既存の PDF だけでなく、画像を直接受け入れます。 JPG、PNG、または TIFF ファイルをアップロードすると、ツールはそれを PDF に変換し、1 ステップで OCR を実行し、検索可能な PDF を返します。これは、既存の PDF ではなく画像ファイルから開始する場合に最も効率的なパスです。

Google ドライブでは、これもワンステップで処理されます。画像をドライブにアップロードし、右クリックして、「プログラムから開く」→「Google ドキュメント」を選択します。 Drive は画像を変換し、OCR を自動的に実行します。結果は、検索可能な PDF ではなく、編集可能な Google ドキュメント ドキュメントになりますが、必要に応じてそこから PDF としてダウンロードできます。

OCR の精度を左右するのは画像品質

OCR はピクセルを読み取ります。入力画像の品質によって、テキストがどの程度正確に認識されるかが直接決まります。 200 DPI 以上で印刷されたドキュメントの鮮明でコントラストの高い写真は、通常、非常に高い精度で変換されます。照明が不十分な場所で斜めから撮影したぼやけた携帯電話の写真では、使用する OCR エンジンに関係なく、多くのエラーが発生します。

検索可能な PDF を作成するために物理的なドキュメントを撮影する場合、いくつかの点で結果が大幅に向上します。ページ全体に影のないフラットで均一な照明。カメラは斜めではなくドキュメントの真上にあります。そして文書は湾曲せずに平らに置かれます。 Microsoft Lens や Adob​​e Scan などの携帯電話スキャン アプリは、OCR の前に自動遠近補正とコントラスト強調を適用するため、標準的なカメラの写真よりも優れた結果が得られることがよくあります。

出力の確認

変換後、PDF を開いて、文書内に表示される単語で Ctrl+F を押して、OCR が機能することを確認します。見つかった場合、テキスト レイヤーは機能します。文章を選択してコピーし、テキスト エディタに貼り付けて、文字化けではなく正しいことを確認してください。アーカイブされる文書や検索に利用される文書の場合、OCR の精度について数ページのスポット チェックを行うことは、数分間かかる価値があります。

OCR 後の PDF Compression パスもファイル サイズの削減に役立ちます。フル解像度の画像と埋め込みテキスト レイヤーを組み合わせると、特に複数ページの画像スキャンの場合、予想よりも大きなファイルが生成される可能性があります。

WukongPDF

PDF OCR を試してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →