PDF を Word に変換すると、ほとんどの場合、元とは異なったものが生成されます。コンテンツはきれいに転送されるはずであるように見えるため、これには人々が驚きますが、PDF と Word は根本的に異なる方法で文書情報を保存します。違いは、変換によってレイアウトが変更される理由を説明します。どの違いが最も重要かを知ることは、出力を修正するか、別のアプローチを採用するかを決定するのに役立ちます。

主な違い: 固定レイアウトとフローテキスト
PDF は固定レイアウト形式です。すべての文字はページ上で正確な位置を持ち、X 座標と Y 座標は決して変わりません。視覚的な結果は常に同じです。 Word は流れるような文書形式です。テキストはルール (余白、フォント サイズ、段落間隔) に従ってフローされ、これらのパラメーターのいずれかが変更されるとリフローされます。
PDF を Word に変換する場合、コンバーターは固定位置からフロー テキストを再構築する必要があります。同じ行に出現する文字をテキスト ランにグループ化し、改行を識別し、どの改行がソフト (テキストが折り返されている) でどの改行がハード (実際の段落の終わり) かを判断しようとします。この再構築は不完全であるため、変換された Word 文書の改行、段落間隔、およびテキストの流れが元の文書と異なる場合があります。
PDF を Word に変換してみる
インストールは必要ありません。ブラウザで直接動作します。
フォントと間隔の変更
PDF でコンピュータにインストールされていないフォントが使用されている場合、Word はそのフォントを最も近い利用可能な代替フォントに置き換えます。置換されたフォントには異なる文字幅、異なる間隔などの異なるメトリクスがあり、テキストの折り返し方法やコンテンツが占めるスペースの量が変わります。 PDF では 1 ページに収まる段落が、Word では 2 ページに収まる場合があります。これは、代替フォントの文字幅が若干広いためです。
PDF で設定された文字間隔や単語間隔も、変換中に失われるか近似されることがよくあります。元の文書でトラックアウト テキスト (文字間の間隔が広くなった) が使用されている場合、変換された Word バージョンではこれが正確に保持されない可能性があります。
テーブルと複数列のレイアウト
PDF 内の表は、表としてはまったく保存されないことが多く、たまたま表のように見えるテキストが配置されています。コンバーターは、テキスト位置の視覚的なレイアウトからテーブル構造を推測する必要があります。この推論が正しい場合、Word 出力には適切な表が含まれます。これが間違っていると、間違った列にテキストが入ったり、別々であるべきセルが結合されたり、表だったテキストが変な間隔のプレーンな段落になったりします。
複数列のレイアウトでも同様の課題があります。 Word に変換された 2 列のニュースレターでは、コンバーターが列の流れではなく位置の順序でテキストを読み取るため、両方の列のテキストを別個の列として維持するのではなく、インターリーブする場合があります。
画像とグラフィック要素
通常、画像は画像として変換されます。画像は Word 文書に表示されますが、元の正確な位置ではなく、フローティング オブジェクトまたはインライン オブジェクトとして配置されます。 PDF で画像の周囲に慎重に配置されたテキストが、Word では同じように折り返されなくなる場合があります。装飾要素、背景色、および特定のグラフィック効果はまったく変換されない場合があります。
変換されたドキュメントをどうするか
報告書、契約書、手紙などの単純なテキストの多い文書の場合、変換では通常、いくつかのクリーンアップを行うことで使用可能な結果が得られます。段落の間隔、フォントの置換、ヘッダーとフッターの再構築など、手動による書式設定の修正が必要になることを受け入れます。複雑なレイアウトの場合は、視覚的なレイアウトを再作成しようとして部分的に失敗する変換よりも、きれいなテキストを抽出できる PDF Converter の方が便利な場合があります。
テキスト コンテンツだけが必要で、書式設定は気にしない場合は、PDF から新しい Word 文書にコピーして貼り付ける (そして、独自の書式設定を最初から行う) 方が、レイアウトを誤って再構築した変換をクリーンアップするよりも速い場合があります。複雑な表やレイアウトを含む文書を編集して PDF 形式に戻す必要がある場合は、変換を修正するよりも Word で最初から再構築する方が速いかどうかを検討してください。
PDF を Word に変換してみる
インストールは必要ありません。ブラウザで直接動作します。
