Tips & Tricks

PDF ドキュメントを英語に翻訳する方法

PDF は、簡単にテキストを抽出して編集できるように設計されていないため、PDF の翻訳は、Web ページやテキスト ファイルの翻訳よりも複雑です。最も効果的なアプローチは、実際のテキストを含むデジタル PDF、またはスキャンされた文書など、使用している PDF の種類と、元の書式を保持するために翻訳された出力がどの程度必要かによって異なります。

How to Translate a PDF Document to English

PDF の翻訳が思ったより難しい理由

翻訳ツールは、編集可能なテキスト、つまり処理して別の言語で返すことができる単語の文字列に最適に機能します。 PDF はそのようには機能しません。 PDF は、テキストが正確な座標でページ上に配置される固定レイアウトのドキュメントです。 PDF に実際のテキストが含まれている場合でも、それをきれいに抽出し、翻訳されたテキストを同じ位置に戻すことは技術的に困難です。

この課題は、テキストがまったく含まれておらず、テキストの画像だけが含まれているスキャンされた PDF の場合にはさらに複雑になります。これらは、翻訳を行う前に OCR が必要です。また、複数の列、表、テキストが埋め込まれたグラフなど、複雑なレイアウトを持つ文書の場合、優れた翻訳ツールでも元の構造を維持するのは困難です。

WukongPDF

PDF を翻訳してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →

オプション 1: 専用の PDF 翻訳ツール を使用する

デジタル PDF の最も直接的なルートは、PDF 翻訳専用に構築されたツールです。 www.wukongpdf.com の WukongPDF の Translate PDF 機能は、PDF のアップロード、ターゲット言語の選択、翻訳版のダウンロードというプロセス全体を処理します。このツールはテキストを抽出して翻訳し、出力内のレイアウトを保持しようとします。

このアプローチは、レポート、手紙、記事、契約書など、レイアウトが単純な単純な文書に最適です。複雑な複数列のレイアウトや高度なデザインの文書では、翻訳後のテキストの長さが元のテキストと異なることが多く、列幅や改ページが乱れることがあるため、翻訳後に手動でクリーンアップする必要がある場合があります。

オプション 2: Word に変換、翻訳、再エクスポート

結果をより詳細に制御するには、特に書式設定が重要な文書の場合、まず PDF を Word に変換し、次に Word で翻訳してから、PDF に再エクスポートします。

  • ステップ 1: WukongPDF の PDF to Word ツールを使用して、PDF を Word に変換します。これにより、翻訳前に抽出の問題を確認して修正できる編集可能な文書が得られます。
  • ステップ 2: Microsoft Word の組み込み翻訳 ([レビュー] > [翻訳] > [ドキュメントの翻訳]) を使用するか、コンテンツを DeepL または Google 翻訳に貼り付けます。 Word の翻訳では、基本的な書式を維持したまま、翻訳されたテキストを含む新しい文書が作成されます。
  • ステップ 3: 翻訳された Word 文書を確認し、書式設定の問題を修正してから、PDF にエクスポートし直します。

このルートは最も制御しやすく、最もきれいな結果を生成しますが、より多くの手順が必要になります。広く配布する文書や、翻訳版でプロフェッショナルに見える必要がある文書の場合は、これを実行する価値があります。

オプション 3: Google 翻訳ドキュメントのアップロード

Google 翻訳は直接 PDF アップロードをサポートしています。 translation.google.com にアクセスし、[ドキュメント] タブをクリックして、PDF をアップロードし、ターゲット言語を選択して、[翻訳] をクリックします。 Google は、基本的なレイアウトを維持しようとして、ドキュメントの翻訳版を返します。

文書の内容を素早く理解するのに適した品質です。プロ品質の出力の信頼性は低くなります。書式は劣化し、複雑なレイアウトは崩れ、翻訳精度は言語ペアによって異なります。外国語の文書の内容を理解するのに最適です。他の人と共有する翻訳ドキュメントを作成する場合は、配布する前に慎重にレビューしてください。

スキャンしたPDFを翻訳する

スキャンされた PDF には、翻訳の前に追加の手順 (OCR) が必要です。テキストの画像は、翻訳ツールで処理する前に実際のテキストに変換する必要があります。まずスキャンした PDF を OCR ツールで実行し、次に上記のいずれかの翻訳方法を実行します。

OCR の精度は翻訳の品質に影響します。OCR がソース言語の文字を誤って読み取ると、その誤った文字の翻訳も間違ったものになります。入力された文書をクリーンにスキャンする場合、OCR は非常に正確です。手書きの文書や低品質のスキャンの場合は、エラーが増えることが予想され、出力を注意深く確認する計画を立ててください。

機械翻訳に期待できること

機械翻訳は劇的に改善され、ほとんどのコンテンツ、特にスペイン語-英語、フランス語-英語、ドイツ語-英語、中国語-英語などの共通言語ペアを適切に処理できます。文書の意味を理解するには、通常、機械翻訳で十分です。

法律文書や医療文書、署名中の契約書、または正確さが重要なコンテンツの場合は、機械翻訳を使用して文書を理解し、人間の翻訳者に最終バージョンをレビューしてもらいます。専門的な法律用語、慣用的な表現、または文化的に特有のコンテンツを機械翻訳すると、意味が微妙に間違っているもっともらしく聞こえるテキストが生成されることがあります。

WukongPDF

PDF を翻訳してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →