Честный ответ: в основном да, с оговорками. Для простых текстовых документов форматирование сохраняется хорошо. Для сложных макетов почти всегда требуется некоторая очистка. Понимание того, что конвертируется чисто, а что нет, позволяет вам сформулировать правильные ожидания и работать быстрее.

Что хорошо конвертирует
Основной текст, заголовки, структура абзацев, форматирование полужирным и курсивом, основные списки и выбор шрифтов — все это в большинстве случаев надежно конвертируется. 10-страничный бизнес-отчет со стандартным форматированием (заголовки, основные абзацы, несколько изображений) обычно преобразуется в Word с минимальной очисткой. Текст доступен для редактирования, структура не повреждена, и документ можно использовать немедленно.
Макеты с одной колонкой и четкой типографской иерархией конвертируются лучше, чем дизайны с несколькими колонками. Документы, оригинал которых был создан из источника Word (многие деловые документы, отчеты, контракты), как правило, преобразуются наиболее чисто, поскольку PDF был создан на основе структуры документа, которую конвертер часто может восстановить.
Попробуйте PDF в Word
Никакой установки не требуется. Работает прямо в вашем браузере.
Что обычно требует очистки
Таблицы являются наиболее распространенной проблемой преобразования. Простые таблицы с четкими границами часто конвертируются правильно. Сложные таблицы с объединенными ячейками, вложенными таблицами или необычным форматированием часто выравниваются или разбиваются на отдельные текстовые блоки. Быстрое визуальное сравнение с исходным PDF позволяет выявить эти проблемы.
Макеты с несколькими колонками — информационные бюллетени, научные статьи в двухколоночном формате, страницы в журнальном стиле — почти всегда требуют ручной реконструкции. Конвертер читает текст по странице слева направо, а не столбец за столбцом, поэтому текст из соседних столбцов чередуется. Верхние и нижние колонтитулы иногда преобразуются в обычный текст, а не в настоящие поля верхнего и нижнего колонтитула Word. Точные интервалы и позиционирование в оформленных документах немного меняются.
Инструмент существенно меняет ситуацию
Не все преобразователи PDF в Word одинаковы. Adobe Acrobat Pro неизменно дает наилучшие результаты для сложных макетов, поскольку использует более сложный анализ макета. В качестве бесплатных опций инструмент PDF Converter компании WukongPDF хорошо справляется с форматированием стандартных деловых документов. Встроенный импорт PDF в Документах Google подходит для простых документов. Бесплатные конвертеры обычно хорошо обрабатывают текст, но менее надежны для таблиц и сложных макетов, чем платные инструменты.
Если один инструмент дает плохие результаты при работе с конкретным документом, попробуйте другой. Разные конвертеры используют разные алгоритмы, и один и тот же документ, который плохо конвертируется в одном инструменте, может конвертироваться без ошибок в другом.
Отсканированные PDF-файлы в первую очередь нуждаются в распознавании текста
Если ваш PDF представляет собой отсканированный документ (сфотографированный, а не созданный в цифровом формате), преобразование не будет извлекать текст, потому что его нечего извлекать. Каждому конвертеру для работы необходимы реальные текстовые данные. Сначала запустите OCR, чтобы добавить текстовый слой, а затем преобразуйте его в Word. Некоторые конвертеры автоматически запускают распознавание текста как часть процесса преобразования; другие требуют, чтобы вы сначала выполнили распознавание текста отдельно.
Когда следует принимать несовершенное преобразование
Для большинства задач редактирования преобразование, правильное на 90 % и требующее 10 минут очистки, выполняется быстрее, чем воссоздание документа с нуля. Цель — это не идеальная копия, а редактируемая отправная точка. Примите тот факт, что за большинством преобразований следует некоторая работа по ручному форматированию, запланируйте ее, и вы обнаружите, что преобразование PDF в Word действительно полезно, даже если оно не идеально.
Попробуйте PDF в Word
Никакой установки не требуется. Работает прямо в вашем браузере.
