書式を失わずに PDF を翻訳できますか?

PDF の書式設定を維持したまま翻訳することは、ほとんどの人が予想しているよりもはるかに困難です。課題は翻訳そのものではありません。それは、PDF は固定レイアウト形式であり、テキストが置き換えられるように設計されていないということです。正直な答えは、それに近づけることはできますが、書式設定がどの程度維持されるかは、元の文書の複雑さに大きく依存します。

Can You Translate a PDF Without Losing Formatting?

PDF の翻訳は見た目よりも難しい理由

PDF は、テキストをリフロー可能な段落としてではなく、ページ上に配置された文字として保存します。テキストを翻訳すると、単語数と文字数がほとんどの場合変化します。英語テキストのスペイン語翻訳は通常 20 ～ 30% 長くなります。ドイツ語はさらに長くなります。中国語や日本語の翻訳は短いことが多いです。異なる長さの翻訳済みテキストを交換すると、元のテキストの長さに基づいて設計されたレイアウトが壊れます。

これに加えて、PDF はアラビア語やヘブライ語のような右から左に読む複雑な文字をネイティブにサポートしていないこと、元のフォントにはターゲット言語に必要な文字が含まれていない可能性があること、PDF エディターで翻訳されたテキストはワードプロセッサと同じ方法でリフローしないことがよくあり、その複雑さが明らかになります。

PDF を翻訳してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →

最も信頼性の高いアプローチ: 変換、翻訳、エクスポート

正確な翻訳ときれいな書式設定の両方が重要な文書の場合、最良のワークフローは、PDF を Word に変換し、Word 文書を翻訳してから、PDF にエクスポートし直すことです。これにより、翻訳ステップに適切なワードプロセッサが提供されます。テキストは正しくリフローされ、スタイルは一貫して適用され、レイアウトを完全に制御できます。

変換ステップは、レポート、契約書、記事など、単純なレイアウトを持つテキストの多いドキュメントで最も効果的です。 Word はすべての PDF レイアウトを完全に再構築するわけではないため、複数の列、テキストボックス、表、埋め込みグラフィックを含む複雑なレイアウトの場合は、変換後に手動で書式設定する必要があります。

WukongPDF の PDF Converter ツールは、PDF から Word へのステップを処理します。その後、DeepL、Google 翻訳の文書アップロード機能を使用して Word に翻訳するか、手動で翻訳した文書を PDF にエクスポートして戻すことができます。

専用のPDF翻訳ツールの使用

いくつかのツールは直接 PDF 翻訳を提供しています。PDF をアップロードすると、翻訳された PDF が返されます。 DeepL と Google 翻訳はどちらも PDF ファイルのアップロードをサポートしています。これらのツールは、テキストを所定の位置に置き換えながら、レイアウトを保持しようとします。最小限の書式設定を備えたシンプルでテキストの多いドキュメントの場合、多くの場合、結果は非常に良好になります。複雑なレイアウト、表、または列間隔が狭いドキュメントの場合、書式設定が頻繁に崩れます。

これらのツールによる翻訳の品質は大幅に向上しており、ほとんどの一般的な言語ペアで概して正確です。主な変数は、翻訳の正確さではなく、フォーマットの忠実度です。

「書式設定を維持する」とは実際に何を意味するのか

ほとんどの翻訳のユースケースでは、「書式設定を維持する」ことが重要です。つまり、見出しは見出しらしく、段落は読みやすく、表は表のままで、文書はナビゲート可能です。特にターゲット言語がソース言語よりも大幅に長いまたは短い場合、元のレイアウトをピクセル単位で完璧に再現する必要はありません。

翻訳されたドキュメントが元のドキュメントと視覚的に同一である必要がある場合 (同じ改ページ、同じ列幅、同じテキスト位置)、単純なファイル変換ではなく、プロフェッショナルな DTP 作業を検討していることになります。これは、公開された資料に対する合理的な要件です。社内文書や参考翻訳としてはやりすぎです。

スキャンされたPDFsを翻訳しています

スキャンされた PDF には追加の手順が必要です。最初に OCR してテキストを抽出し、次に翻訳します。 OCR がないと、翻訳ツールは処理するテキストのない画像を認識します。スキャンした PDF を OCR ツールで実行してテキストレイヤー PDF または Word 文書を取得し、通常どおり翻訳を続行します。

スキャンされた文書の場合、翻訳後の書式の保持を保証することは基本的に不可能です。スキャン自体は画像であり、翻訳されたテキストを中心にレイアウトを再構築するには手動で再構築する必要があります。 (外観ではなく) 意味のみが重要なスキャンされた文書の場合、OCR を介してテキストを抽出し、プレーンテキストとして翻訳する方が高速であり、より現実的な期待を設定できます。

ドキュメントへのアプローチの一致

単純なテキスト文書、書式設定が重要: 直接 PDF 翻訳ツールを使用して、出力を確認します。単純なテキスト文書。書式は関係ありません。テキストを抽出し、翻訳し、別の平易な言語バージョンとして配布します。複雑なレイアウトや書式設定が重要: Word への変換、翻訳、再フォーマット、PDF へのエクスポート。スキャンされたドキュメント: 最初に OCR を行い、次に複雑さに応じたアプローチを使用して翻訳します。

これらすべてを同じようにうまく処理できる単一のツールはありません。開始する前に自分がどのケースに該当するかを把握しておくと、特定の文書では機能しないアプローチを試す時間を節約できます。

PDF を翻訳してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →