Others

Можете ли вы преобразовать PDF в аудиофайл?

Да, преобразование PDF в аудио — это двухэтапный процесс: извлеките текст, а затем преобразуйте его в речь. Технология значительно улучшилась, и результаты можно использовать для большинства целей, хотя опыт во многом зависит от того, как был создан PDF и какой механизм преобразования текста в речь вы используете.

Can You Convert a PDF to an Audio File?

Почему не существует прямого преобразования PDF в аудио

PDF не содержат аудиоданных — они содержат текст, изображения и информацию о макете. Преобразование PDF в аудио означает извлечение текста из PDF и последующий синтез речи из этого текста. Это две отдельные операции, поэтому ни один инструмент не конвертирует PDF напрямую в MP3 за один шаг: он всегда включает извлечение текста с последующим синтезом текста в речь.

Качество вывода во многом зависит от качества извлечения текста. PDF с чистым, правильно структурированным текстом создает естественный звук. PDF, который представляет собой отсканированное изображение, имеет нарушенную кодировку текста или использует необычное форматирование, воспроизводит звук с ошибками — неправильно читаемыми словами, фрагментами, прочитанными не по порядку, или искаженными отрывками.

WukongPDF

Попробуйте PDF OCR

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →

Использование встроенной в ОС системы преобразования текста в речь

Самый простой подход на Mac: откройте PDF, выделите весь текст (Cmd+A), выберите «Правка» → «Речь» → «Начать говорить». Встроенная функция преобразования текста в речь Mac читает выбранный контент вслух. Это не аудиофайл, который можно сохранить — это воспроизведение в реальном времени, но для прослушивания PDF во время выполнения чего-то другого он работает без каких-либо дополнительных инструментов.

В Windows экранный диктор (встроенная программа чтения с экрана) может читать содержимое PDF вслух, когда файл открыт в средстве просмотра PDF. Ярлык для начала чтения — Ctrl+Windows+Enter. Опять же, это живое воспроизведение, а не файл, который вы можете сохранить.

Создание аудиофайла из PDF Text

Чтобы создать настоящий аудиофайл (MP3, M4A, WAV), который вы можете слушать в автономном режиме или поделиться, рабочий процесс следующий: извлеките текст из PDF, вставьте его в службу преобразования текста в речь и загрузите аудиовыход. Некоторые службы занимаются этим напрямую.

Natural Reader, Speechify и Balabolka (Windows, бесплатно) поддерживают ввод текста и экспортируют аудиофайлы. API преобразования текста в речь Google и Amazon Polly программно создают высококачественный естественно звучащий звук. Для полного PDF копируйте текст по главам или раздел за разделом, конвертируйте каждую часть и при необходимости присоединяйте аудиофайлы.

PDF должен содержать выбираемый текст

Извлечение текста работает только в том случае, если PDF имеет реальный текстовый слой. Для отсканированных файлов PDF, содержащих только изображения, сначала запустите OCR PDF, чтобы добавить текстовый слой с возможностью поиска, затем приступайте к извлечению текста и преобразованию аудио. Без оптического распознавания текста системе преобразования текста в речь нечего читать — в файле нет текста, только пиксели.

Быстрый тест: попробуйте выбрать предложение в PDF. Если отдельные слова выделены, текстовый слой существует. Если вместо этого выбрана прямоугольная область страницы, она содержит только изображение и требует оптического распознавания символов, прежде чем станет возможным преобразование звука.

Ожидаемые ограничения

Даже при чистом извлечении текста и хорошем преобразовании текста в речь преобразование PDF в аудио имеет известные ограничения. Таблицы и рисунки не преобразуются в аудио осмысленно — механизм преобразования текста в речь, читающий таблицу, читает ячейку за ячейкой в ​​порядке документа, который часто звучит как случайный список чисел. Сноски и боковые панели можно читать в середине предложения, если они расположены таким образом на текстовом слое PDF. Математические обозначения, химические формулы и кодовые блоки читаются как отдельные символы, а не как значимое содержимое.

Для повествовательного текста — статей, отчетов, книг, предложений — аудиоконвертация работает хорошо, и результат действительно приятен для прослушивания. Для сильно структурированных или технических документов аудио может потребовать больше внимания, чем непосредственное чтение документа.

WukongPDF

Попробуйте PDF OCR

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →