Можете ли вы перевести PDF без потери форматирования?

Перевести PDF, сохранив его форматирование, действительно сложно — даже больше, чем ожидает большинство людей. Проблема не в самом переводе; дело в том, что PDF — это формат с фиксированным макетом, который не предназначен для замены текста. Честный ответ: приблизиться можно, но степень сохранения форматирования во многом зависит от сложности исходного документа.

Can You Translate a PDF Without Losing Formatting?

Почему перевод PDF сложнее, чем кажется

PDF хранит текст в виде позиционированных символов на странице, а не в виде перекомпонуемых абзацев. При переводе текста количество слов и количество символов почти всегда меняются. Испанские переводы английского текста обычно на 20-30% длиннее. Немецкий может быть еще длиннее. Китайские или японские переводы часто короче. Замена переведенного текста другой длины нарушает макеты, которые были разработаны с учетом длины исходного текста.

Добавьте к этому, что PDF изначально не поддерживает сложные сценарии, такие как арабский или иврит, которые читаются справа налево, что шрифты в оригинале могут не содержать символы, необходимые для целевого языка, и что переведенный текст в редакторе PDF часто не перекомпоновывается так, как это делают текстовые процессоры — и сложность становится очевидной.

Попробуйте перевести PDF

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →

Самый надежный подход: конвертировать, переводить, экспортировать

Для документов, где важны как точный перевод, так и четкое форматирование, лучший рабочий процесс: преобразовать PDF в Word, перевести документ Word, а затем экспортировать обратно в PDF. Это дает вам подходящий текстовый процессор для этапа перевода — текст корректно перекомпоновывается, стили применяются последовательно, и вы имеете полный контроль над макетом.

Этап преобразования лучше всего работает с текстовыми документами с простым макетом — отчетами, контрактами, статьями. Сложные макеты с несколькими столбцами, текстовыми полями, таблицами и встроенной графикой после преобразования потребуют ручного форматирования, поскольку Word не полностью восстанавливает каждый макет PDF.

Инструмент PDF Converter компании WukongPDF обрабатывает этап преобразования PDF в Word, после чего вы можете перевести в Word с помощью DeepL, функции загрузки документов Google Translate, или вручную, а затем экспортировать переведенный документ обратно в PDF.

Использование специальных инструментов перевода PDF

Некоторые инструменты теперь предлагают прямой перевод PDF — вы загружаете PDF и получаете обратно переведенный PDF. DeepL и Google Translate поддерживают загрузку файлов PDF. Эти инструменты пытаются сохранить макет, заменяя текст на месте. Для простых документов с большим количеством текста и минимальным форматированием результаты часто бывают весьма хорошими. Для сложных макетов, таблиц или документов с малым расстоянием между столбцами форматирование часто нарушается.

Качество перевода с помощью этих инструментов значительно улучшилось и в целом является точным для большинства распространенных языковых пар. Основной переменной является точность форматирования, а не точность перевода.

Что на самом деле означает «сохранение форматирования»

В большинстве случаев перевода «сохранение форматирования» не требуется. означает: заголовки выглядят как заголовки, абзацы читабельны, таблицы остаются таблицами, а документ доступен для навигации. Это не обязательно означает идеальное воспроизведение исходного макета с точностью до пикселя, особенно если целевой язык значительно длиннее или короче исходного.

Если вам нужно, чтобы переведенный документ был визуально идентичен оригиналу — такие же разрывы страниц, та же ширина столбцов, такое же расположение текста — вы смотрите на профессиональную настольную издательскую работу, а не на простое преобразование файла. Это разумное требование к публикуемым материалам; это излишне для внутренних документов или справочных переводов.

Перевод отсканированных PDFs

Отсканированные PDF требуют дополнительного шага: сначала OCR для извлечения текста, а затем перевода. Без OCR инструменты перевода видят изображение без текста для работы. Запустите отсканированный PDF с помощью инструмента оптического распознавания символов, чтобы получить текстовый PDF или документ Word, а затем продолжите перевод как обычно.

Для сканированных документов сохранение форматирования после перевода гарантировать практически невозможно — скан сам по себе является изображением, а перестроение макета вокруг переведенного текста требует ручной реконструкции. Для отсканированных документов, где имеет значение только смысл (а не внешний вид), извлечение текста с помощью оптического распознавания символов и перевод его в обычный текст происходит быстрее и дает более реалистичные ожидания.

Соответствие подхода к документу

Простой текстовый документ, форматирование имеет значение: используйте инструмент прямого перевода PDF и просмотрите результат. Простой текстовый документ, форматирование не имеет значения: извлекайте текст, переводите, распространяйте как отдельную версию на открытом языке. Сложная верстка, форматирование имеет значение: конвертируйте в Word, переводите, переформатируйте, экспортируйте в PDF. Отсканированный документ: сначала распознавание текста, затем перевод с использованием подхода, соответствующего сложности.

Ни один инструмент не справляется со всеми этими задачами одинаково хорошо. Знание того, в каком случае вы находитесь, прежде чем начать, экономит время, затрачиваемое на попытки подходов, которые не подходят для вашего конкретного документа.

Попробуйте перевести PDF

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →