Преобразование изображения в PDF с возможностью поиска представляет собой двухэтапный процесс: сначала изображение становится PDF, затем OCR добавляет текстовый слой, чтобы можно было искать и выбирать содержимое. Оба шага можно выполнить вместе с помощью инструментов, которые его поддерживают, или по отдельности, если вы предпочитаете больше контроля над каждым этапом.

Разница между обычным изображением PDF и изображением, доступным для поиска
Когда вы конвертируете изображение в PDF без оптического распознавания символов, вы получаете PDF, который отображает изображение — вы можете открыть его, увеличить масштаб, распечатать — но вы не можете выбирать текст, искать слова или копировать содержимое. По сути, это фотография, завернутая в контейнер PDF. В формате PDF с возможностью поиска под изображением добавляется скрытый текстовый слой, созданный с помощью оптического распознавания символов, считывающего текст на изображении. Внешний вид не изменился, но теперь Ctrl+F находит слова и текст можно скопировать.
Попробуйте PDF OCR
Никакой установки не требуется. Работает прямо в вашем браузере.
Выполнение обоих шагов одновременно
Инструмент OCR PDF от WukongPDF принимает изображения напрямую, а не только существующие PDF. Загрузите файл JPG, PNG или TIFF, и инструмент преобразует его в PDF и запускает распознавание текста за один шаг, возвращая PDF с возможностью поиска. Это наиболее эффективный путь при запуске из файла изображения, а не из существующего PDF.
Google Диск также решает эту проблему за один шаг: загрузите изображение на Диск, щелкните его правой кнопкой мыши и выберите «Открыть с помощью» → «Документы Google». Диск преобразует изображение и автоматически запускает распознавание текста. В результате получается редактируемый документ Google Docs, а не PDF с возможностью поиска, но при необходимости вы можете скачать его оттуда как PDF.
Качество изображения влияет на точность оптического распознавания символов
OCR считывает пиксели — качество входного изображения напрямую определяет, насколько точно распознается текст. Резкая, высококонтрастная фотография напечатанного документа с разрешением 200 точек на дюйм или выше обычно преобразуется с очень высокой точностью. Размытая фотография телефона, сделанная под углом при плохом освещении, будет содержать много ошибок независимо от того, какой механизм оптического распознавания символов вы используете.
Если вы фотографируете физический документ для создания PDF с возможностью поиска, несколько вещей значительно улучшают результаты: ровное, равномерное освещение без теней по всей странице; камера непосредственно над документом, а не под углом; и документ лежит ровно, а не изогнут. Приложения для сканирования телефона, такие как Microsoft Lens и Adobe Scan, перед распознаванием текста применяют автоматическую коррекцию перспективы и повышение контрастности, поэтому они часто дают лучшие результаты, чем стандартная фотография с камеры.
Проверка вывода
После преобразования убедитесь, что распознавание текста работает, открыв PDF и нажав Ctrl+F со словом, которое вы видите в документе. Если он найден, текстовый слой работоспособен. Попробуйте выделить отрывок и скопировать его — вставьте в текстовый редактор, чтобы убедиться, что символы верны, а не искажены. Для документов, которые будут заархивированы или использованы для поиска, выборочная проверка нескольких страниц на предмет точности оптического распознавания стоит потраченных на это нескольких минут.
Проход PDF Compression после оптического распознавания символов также может помочь уменьшить размер файла — сочетание изображения с полным разрешением и встроенного текстового слоя может привести к созданию файлов большего размера, чем ожидалось, особенно при сканировании многостраничных изображений.
Попробуйте PDF OCR
Никакой установки не требуется. Работает прямо в вашем браузере.
