Tips & Tricks

PDF をオーディオブックに変換する方法

PDF をオーディオブック (聞くことのできる音声ファイル) に変換すると、運転中、運動中、または読書ができない作業中にドキュメントのコンテンツにアクセスできるようになります。このプロセスはシングルクリックで変換できるわけではありませんが、ほとんどの人が思っているよりも簡単にアクセスできます。主な変数は、オーディオの品質、コンテンツがリスニングにどの程度適しているか、自動化と手動作業のどちらをどの程度希望するかです。

How to Convert a PDF to an Audiobook

最初: PDF には選択可能なテキストが必要です

テキスト読み上げツールは実際のテキストを読み取ります。テキストの画像を読み取ることはできません。 PDF がテキスト レイヤーのないスキャンされたドキュメントである場合は、最初に OCR を実行する必要があります。テキスト レイヤーのない スキャンされた PDF では、音声出力が生成されないか、ツールはページ番号とメタデータのみを読み取ることがあります。

すぐに確認してください。PDF から文を選択してコピーしてみてください。実際のテキストとしてコピーすると、PDF はテキスト読み上げの準備が整います。何も選択されない場合、または画像としてコピーされる場合は、まず www.wukongpdf.com で WukongPDF の OCR ツールを使用して OCR を実行し、テキスト レイヤーを追加してから続行します。

WukongPDF

PDF OCR を試してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →

方法 1: 組み込みの読み上げ機能

最も単純なアプローチでは、オーディオ ファイルは生成されません。PDF をリアルタイムで読み上げます。

  • Adobe Reader (Windows/Mac): 表示 >声に出して読み上げる > 「読み上げ」を有効にしてから、「このページのみを読む」または「文書の最後まで読む」を有効にします。 Reader は、システムの音声合成エンジンを使用して PDF を読み上げます。
  • Microsoft Edge: Edge で PDF を開き、ツールバーの [読み上げ] ボタンをクリックします。 Edge は、従来のシステム音声よりもはるかに自然な音声であるニューラル テキスト読み上げ音声を使用します。
  • iPhone/iPad: iOS には、画面読み上げ機能が組み込まれています。任意のアプリで PDF を開き、[設定] > [設定] に移動します。アクセシビリティ >会話の内容 >画面を読み上げてから、2 本の指で画面の上部から下にスワイプしてアクティブにします。画面上にあるものをすべて読み取ります。

これらのリアルタイム方法は便利ですが、オフラインで聴いたり、専用のオーディオ プレーヤーに転送したりできるファイルは生成されません。適切な音声ファイルを取得するには、以下のいずれかの方法を使用してください。

方法 2: テキストに変換してから TTS ツールを使用する

適切な音声ファイルの場合、ワークフローは次のとおりです: PDF からテキストを抽出 → テキスト読み上げサービスを使用してテキストを音声に変換 → 音声を MP3 または M4B として保存します。

ステップ 1: テキストを抽出します。 PDF から Word へのコンバーターを使用して、テキストを編集可能な形式に変換します。www.wukongpdf.com の WukongPDF は、PDF を Word に変換し、編集、クリーンアップ、TTS ツールへの貼り付けが可能な形式のテキストを提供します。ヘッダー、フッター、ページ番号、および音声で意味をなさないコンテンツを削除します (「図 3.2」は、図が存在しない音声では役に立ちません)。

ステップ 2: テキストを音声に変換します。いくつかのサービスは、テキストを受け入れ、高品質の音声でオーディオ ファイルを生成します。イレブンラボ、マーフ、およびナチュラルリーダーはすべて、さまざまな品質レベルでこれを提供します。 Google Text-to-Speech と Amazon Polly は、より大きなドキュメントへのプログラムによるアクセスを提供します。短いドキュメントの場合は、テキストをサービスのインターフェイスに直接貼り付けます。長いドキュメントの場合は、ファイルのアップロードまたは API を使用してください。

方法 3: PDF をオーディオ アプリ専用

いくつかのアプリケーションは、完全な PDF-to-audio パイプラインを処理します。

  • Speechify: ドキュメントを聞くために特別に設計された人気のアプリ。 PDF をアップロードすると、高品質の AI 音声で読み上げられます。 iOS、Android で、Chrome 拡張機能として利用できます。無料利用枠を提供します。
  • NaturalReader: PDF を自然な音声で読み上げる デスクトップおよび Web アプリケーション。有料プランではMP3にエクスポートできます。
  • Voice Dream Reader (iOS): PDF サポートと高品質音声の大規模なライブラリを備えた専用の読み上げアプリです。失読症や視覚障害のあるユーザーに人気です。

オーディオとして機能するコンテンツとそうでないコンテンツ

物語的なテキスト (記事、エッセイ、本の章、散文セクションを含むレポート) は、音声としても機能します。表、チャート、コード ブロック、数式、および視覚的なレイアウトに依存するコンテンツは、音声にまったく適切に変換されません。高密度のデータテーブルを含むビジネスレポートは、口で話しても意味のない数字の羅列になります。変換する前に、ドキュメントのコンテンツが実際にオーディオ形式に適しているかどうか、または直線的に聞くのではなく、ドキュメントをナビゲートして流し読みできる PDF Accessibility 機能の方が適しているかどうかを検討してください。

WukongPDF

PDF OCR を試してみる

インストールは必要ありません。ブラウザで直接動作します。

始める →