Google ドライブで PDF を OCR できますか?

Google ドライブには、スキャンした PDF を Google ドキュメントで開くときに自動的に実行される OCR が組み込まれています。これは無料で、追加のソフトウェアは必要なく、ほとんどの一般的なドキュメントに十分に機能します。知っておく価値のある制限事項はありますが、スキャンされた単純なテキストの場合は、ジョブを確実に処理します。

やり方

スキャンした PDF を Google ドライブにアップロードします。アップロードしたら、ファイルを右クリックし、「プログラムから開く」→「Google ドキュメント」を選択します。 Drive は変換中に OCR を自動的に実行し、結果を編集可能な Google ドキュメントドキュメントとして開きます。元の PDF は変更されずにドライブに残ります。Google はそれと一緒に新しいドキュメントファイルを作成します。

変換されたドキュメントには、上部に認識されたテキストが含まれ、その下に元の各ページの画像が続きます。この二重層アプローチにより、Google が認識した内容と元のページの実際の内容を確認できるため、2 つを並べて比較することで OCR エラーを検出するのに役立ちます。

PDF OCR を試してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →

効果

Google ドライブの OCR は、一般的な言語で書かれた標準的な印刷テキストをきれいに高コントラストでスキャンする場合、正確です。 200 DPI 以上でスキャンされた専門的に印刷されたドキュメントは、通常、ほとんどエラーなく変換されます。複数の言語を処理し、多くの場合、特別な構成を行わなくても、混合言語の文書を認識できます。

出力は Google ドキュメントですぐに編集できるため、テキストを変更する必要がある場合に便利です。必要に応じて、ドキュメントから PDF ([ファイル] → [ダウンロード] → PDF ドキュメント) にエクスポートしたり、ダウンストリームで Word 形式にエクスポートしたりすることもできます。

足りないところ

Google ドライブの OCR は、元のドキュメントのレイアウトを保持しません。表はプレーンテキストとして送信され、複数列の書式設定は線形化され、複雑な書式設定は失われます。認識されたテキストはプレーンな段落であり、視覚的にはソース文書と何ら変わりません。

レイアウトを保持する必要があるドキュメント（再配布するフォーム、元のデザインを保持する必要があるレポート）の場合、Google ドライブ OCR はテキストコンテンツを提供しますが、書式設定を手動で再適用する必要があります。データの検索、編集、抽出にテキストコンテンツのみが必要なドキュメントの場合、書式設定がなくても問題ありません。

低品質のスキャン、色あせたテキスト、手書き、および珍しいフォントでは、エラーが著しく増加します。 CJK 文字 (中国語、日本語、韓国語) は、Google の OCR エンジンでは全般的に改善されていますが、複雑なテキストの場合はラテン文字の精度には依然として遅れています。

専用の OCR ツールが優れている場合

PDF 形式 (Google ドキュメントではなく検索可能な PDF) のままの OCR 出力が必要な場合、Google ドライブは適切なツールではありません。テキストレイヤーを含む PDF に戻すのではなく、Docs ファイルに変換します。そのため、WukongPDF の OCR PDF ツールはスキャンを処理し、元のドキュメントの外観を維持しながらテキストの選択と検索が可能な PDF を返します。「PDF を OCR したい」という場合、これは通常、このことを意味します。 — 彼らは、画像ではなく認識可能なテキストだけを含む同じ文書を返したいと考えています。

多数の文書の一括 OCR や、難しい内容の正確さが重要な文書の場合、ABBYY FineReader のような専用の OCR ソフトウェアは、有料製品であることを犠牲にして、Google ドライブよりも優れた結果をもたらします。きれいにスキャンされたドキュメントを毎日無料で OCR する場合、Google ドライブは十分に処理できるため、ほとんどの人は他に何も必要としません。

PDF OCR を試してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →