Tips & Tricks

Как перевести документ PDF на английский язык

Перевод PDF более сложен, чем перевод веб-страницы или текстового файла, поскольку PDF не предназначены для простого извлечения и редактирования текста. Подход, который работает лучше всего, зависит от того, какой тип PDF у вас есть — цифровой PDF с реальным текстом или отсканированный документ — и насколько вам нужен переведенный результат, чтобы сохранить исходное форматирование.

How to Translate a PDF Document to English

Почему перевод PDF-файлов сложнее, чем кажется

Инструменты перевода лучше всего работают с редактируемым текстом — строкой слов, которую они могут обработать и вернуть на другом языке. PDFs так не работают. PDF — это документ с фиксированным макетом, в котором текст располагается на странице с точными координатами. Даже если PDF содержит реальный текст, аккуратно извлечь его и поместить переведенный текст обратно на те же позиции технически сложно.

Проблема усложняется для отсканированных файлов PDF, которые вообще не содержат текста — только изображения текста. Для этого требуется распознавание текста, прежде чем произойдет какой-либо перевод. А для документов со сложным макетом — многоколоночных, таблиц, диаграмм со встроенным текстом — даже хорошие инструменты перевода с трудом сохраняют исходную структуру.

WukongPDF

Попробуйте перевести PDF

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →

Вариант 1. Используйте специальный инструмент перевода PDF

Самый прямой путь к цифровым PDF — это инструмент, созданный специально для перевода PDF. Функция Translate PDF компании WukongPDF на сайте www.wukongpdf.com выполняет весь процесс — загрузите PDF, выберите целевой язык и загрузите переведенную версию. Инструмент извлекает текст, переводит его и пытается сохранить макет на выходе.

Этот подход лучше всего работает для простых документов с простой версткой — отчетов, писем, статей, договоров. Сложные макеты с несколькими столбцами и тяжело оформленные документы могут потребовать ручной очистки после перевода, поскольку переведенный текст часто имеет длину, отличную от оригинала, и может нарушить ширину столбцов и разрывы страниц.

Вариант 2. Преобразование в Word, перевод и повторный экспорт

Для большего контроля над результатом — особенно для документов, форматирование которых имеет значение — сначала преобразуйте PDF в Word, затем переводите в Word, а затем повторно экспортируйте в PDF.

  • Шаг 1: Преобразуйте PDF в Word с помощью инструмента PDF в Word от WukongPDF. Это дает вам редактируемый документ, в котором вы можете увидеть и исправить любые проблемы с извлечением перед переводом.
  • Шаг 2: Используйте встроенный перевод Microsoft Word («Просмотр» > «Перевести» > «Перевести документ») или вставьте содержимое в DeepL или Google Translate. При переводе Word создается новый документ с переведенным текстом, сохраняя базовое форматирование.
  • Шаг 3: Просмотрите переведенный документ Word, исправьте все проблемы с форматированием, а затем экспортируйте обратно в PDF.

Этот маршрут дает вам наибольший контроль и дает самый чистый результат, но требует больше шагов. Это стоит сделать для документов, которые вы будете широко распространять или которые должны выглядеть профессионально в переведенной версии.

Вариант 3. Загрузка документа Google Translate

Google Translate поддерживает прямую загрузку PDF. Перейдите на сайт Translation.google.com, перейдите на вкладку «Документы», загрузите PDF, выберите целевой язык и нажмите «Перевести». Google возвращает переведенную версию документа, пытаясь сохранить базовый макет.

Качество хорошее для быстрого понимания содержания документа. Он менее надежен для вывода профессионального качества — форматирование часто ухудшается, сложные макеты ломаются, а точность перевода зависит от языковой пары. Для понимания того, что говорит документ на иностранном языке, это отлично. Перед созданием переведенного документа, которым вы поделитесь с другими, внимательно просмотрите его перед распространением.

Перевод отсканированного PDF

Перед переводом отсканированных PDF-файлов требуется дополнительный шаг: распознавание текста. Изображение текста должно быть преобразовано в реальный текст, прежде чем какой-либо инструмент перевода сможет его обработать. Сначала запустите отсканированный PDF с помощью инструмента оптического распознавания символов, а затем примените любой из описанных выше методов перевода.

Точность OCR влияет на качество перевода: если OCR неправильно считывает символы исходного языка, перевод этих неправильно прочитанных символов будет неправильным. Для чистого сканирования печатных документов OCR отличается высокой точностью. В случае рукописных документов или некачественных сканирований ожидайте большего количества ошибок и тщательно проверяйте результат.

Чего ожидать от машинного перевода

Машинный перевод значительно улучшился и хорошо обрабатывает большую часть контента, особенно такие распространенные языковые пары, как испанский-английский, французский-английский, немецкий-английский и китайский-английский. Для понимания смысла документа обычно достаточно машинного перевода.

Для юридических или медицинских документов, подписываемых контрактов или любого контента, где точность имеет решающее значение: используйте машинный перевод, чтобы понять документ, а затем попросите переводчика просмотреть окончательную версию. Машинный перевод технического юридического языка, идиоматических выражений или контента, специфичного для конкретной культуры, может создать правдоподобно звучащий текст, но слегка неверный по смыслу.

WukongPDF

Попробуйте перевести PDF

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →