Tips & Tricks

Как уменьшить PDF, созданный на основе сканирования

Вы только что отсканировали стопку документов — десять страниц, а может быть, и двадцать — и в результате получился PDF размером 45 МБ. Он должен быть отправлен в электронное письмо с ограничением в 25 МБ или на портал подачи со строгими требованиями к размеру файла. Сканирование завершено, документ существует, и теперь вам нужно уменьшить его, не делая нечитабельным. Вот как именно с этим справиться.

How to Shrink a PDF That Was Created From a Scan

Почему отсканированные PDF-файлы начинаются с такого большого размера

В отсканированном формате PDF каждая страница сохраняется как фотография с высоким разрешением. В отличие от PDF, созданного из документа Word, где текст хранится в виде эффективных символьных данных, а изображения сжимаются, отсканированный PDF по сути представляет собой стопку изображений, завернутых в контейнер PDF. При настройках сканера по умолчанию размер каждого изображения страницы может составлять несколько мегабайт.

Большинство сканеров по умолчанию используют цветное сканирование с разрешением 300 точек на дюйм, которое подходит для архивирования важных документов, но создает файлы гораздо большего размера, чем необходимо для документов, которые будут читаться только на экране или отправляться на портал. Десятистраничный документ, отсканированный в цвете с разрешением 300 точек на дюйм, может легко весить 30–50 МБ. Тот же документ, отсканированный с разрешением 150 точек на дюйм в оттенках серого, обычно имеет размер 3–8 МБ — читаемый и отправляемый, и его размер составляет лишь часть исходного размера.

WukongPDF

Попробуйте сжать PDF

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →

Самое быстрое решение: пропустите его через компрессор

В большинстве ситуаций самый быстрый путь от увеличенного Отсканированного PDF до отправляемого файла — это инструмент сжатия на основе браузера. Инструмент PDF Compression компании WukongPDF на сайте www.wukongpdf.com обрабатывает отсканированные документы — загрузите файл, выберите среднее или высокое сжатие, загрузите результат.

Чего ожидать от каждого уровня сжатия отсканированного документа:

  • Низкое сжатие: уменьшение размера на 10–30%. Текст остается четким, изображения практически не страдают. Хорошо, когда качество является приоритетом, а уменьшение размера — вторичным.
  • Среднее сжатие: Уменьшение размера на 40–70%. Текст остается читаемым, изображения имеют незначительное смягчение, незаметное при нормальном размере чтения. Правильный выбор для большинства представлений.
  • Высокая степень сжатия: уменьшение размера на 60–85%. Текст по-прежнему разборчив, но изображения заметно ухудшились. Приемлемо для внутренних документов или черновиков, не идеально для всего, что будет распечатано или внимательно изучено.

После сжатия откройте результат и прокрутите его перед отправкой. Убедитесь, что текст на каждой странице по-прежнему читается — обратите особое внимание на страницы с мелким шрифтом, плотными таблицами или рукописными элементами, которые первыми страдают от агрессивного сжатия.

Преобразование в оттенки серого для дополнительного уменьшения

Данные цветного изображения значительно тяжелее, чем данные в оттенках серого. Цветное сканирование сохраняет три цветовых канала (красный, зеленый, синий) для каждого пикселя; сканирование в оттенках серого сохраняет его. Для документов с большим количеством текста — печатных писем, форм, печатных отчетов — информация о цвете часто не имеет значения: документ выглядит практически так же в оттенках серого, как и в цвете.

Преобразование цветного сканирования в оттенки серого до или во время сжатия может уменьшить размер файла еще на 50–60 % по сравнению со сжатием только цветной версии. Это наиболее эффективно для документов без значимого цветного содержания — печатных страниц, печатных форм, черно-белых фотографий. Не используйте его для документов, в которых цвет несет информацию — медицинских изображений, инженерных чертежей с элементами с цветовой кодировкой или любых документов, в которых читателю необходимо различать цвета.

Если вы можете выполнить повторное сканирование: сначала отрегулируйте настройки

Если исходный документ все еще доступен и сканирование было только что выполнено, стоит потратить две минуты на настройку параметров сканера и повторное сканирование, а не пытаться сжать файл слишком большого размера постфактум. Результат будет меньше и чище, чем сильно сжатое сканирование с высоким разрешением.

  • Для использования только на экране: сканируйте с разрешением 150 точек на дюйм в оттенках серого. Читается на любом экране, файлы остаются небольшими.
  • Для документов, которые можно распечатать: сканируйте с разрешением 200–300 точек на дюйм в оттенках серого. Хорошее качество печати без накладных расходов на цвет.
  • Для архивных целей: сканируйте с разрешением 300 точек на дюйм и храните архивную копию в полном разрешении отдельно от сжатой копии для общего доступа.

Еще один шаг, который стоит сделать: сделайте его доступным для поиска

Пока файл открыт и вы все равно его обрабатываете, рассмотрите возможность использования OCR, чтобы сделать текст доступным для поиска. Сжатый отсканированный файл PDF, который также доступен для поиска, значительно полезнее, чем тот, который просто меньше. Вы можете искать в нем определенный текст, копировать текст из него, и он будет отображаться при поиске в файловой системе по содержимому, а не только по имени файла. Инструмент оптического распознавания символов WukongPDF на сайте www.wukongpdf.com справляется с этой задачей — это отдельный шаг от сжатия, но он занимает такое же количество времени и постоянно повышает удобство использования документа.

WukongPDF

Попробуйте сжать PDF

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →