Отсканированный PDF пятистраничного письма не должен весить 80 МБ. Но часто это так, и причина почти всегда кроется в том, как было настроено сканирование, а не в самом документе. Размер файла отсканированного PDF не имеет ничего общего с количеством текста на странице — он полностью определяется данными изображения, захваченными сканером. Понимание этого различия указывает непосредственно на решение проблемы.

Выставлено слишком высокое разрешение сканера
Это наиболее распространенная причина отсканированных PDF-файлов слишком большого размера. Разрешение сканера измеряется в DPI (точек на дюйм). Чем выше DPI, тем больше данных изображения захватывается и тем больше размер получаемого файла. Многие сканеры по умолчанию имеют разрешение 300 или 600 точек на дюйм, что подходит для архивирования документов, которые вам, возможно, придется распечатать в большом формате или увеличить. Для стандартного текстового документа, которым вы делитесь по электронной почте или загружаете на портал, это излишне.
При разрешении 300 точек на дюйм одна цветная страница формата А4 создает примерно 25 МБ необработанных данных изображения без какого-либо сжатия. Умножьте это на 10-страничный документ, и вы начнете с 250 МБ еще до того, как PDF будет сохранен. Большинство сканеров применяют сжатие автоматически, но отправной точкой по-прежнему остается большой объем данных.
Для текстовых документов разрешения 150 DPI достаточно для получения четкого и читаемого вывода. Для документов с фотографиями или подробными диаграммами разрешение 200 точек на дюйм является разумным пределом для обмена. Сэкономьте 300+ точек на дюйм для реальных нужд архивирования, когда вам может понадобиться позже воспроизвести документ в полном качестве.
Попробуйте сжать PDF
Никакой установки не требуется. Работает прямо в вашем браузере.
Цветное сканирование вместо серого или черно-белого сканирования
При цветном сканировании для каждого пикселя сохраняются три канала данных — значения красного, зеленого и синего. При сканировании в оттенках серого сохраняется только один. Черно-белое (битональное) сканирование сохраняет один бит на пиксель — черный или белый, ничего промежуточного. Разница в размере файла существенна: цветное сканирование обычного текстового документа может быть в 10–20 раз больше, чем тот же документ, отсканированный в черно-белом режиме.
Если ваш документ написан черными чернилами на белой бумаге (что описывает большинство деловых документов, контрактов и форм), сканирование в цвете бесполезно. Сканирование уловит легкий кремовый цвет бумаги, серые тени возле отверстий для скоб и небольшие различия в плотности чернил, но ничего из этого вам не нужно. Переключение в черно-белый режим или режим оттенков серого в настройках сканера значительно сокращает размер файла.
Во время сохранения сжатие не применялось
Некоторые программы сканирования сохраняют отсканированные изображения с минимальным сжатием или без него. Сканер захватывает необработанные данные изображения и записывает их в PDF почти как есть, в результате чего файл оказывается неоправданно большим для того, что он содержит. Это зависит от сканера и программного обеспечения — некоторые по умолчанию применяют агрессивное сжатие, другие почти не касаются его.
Если у вас уже есть отсканированный файл PDF увеличенного размера, пропустите его с помощью инструмента PDF Compression, который часто является самым быстрым решением. Хороший инструмент сжатия, примененный к отсканированному PDF, может уменьшить размер файла на 60–80 % без видимых изменений качества — особенно для черно-белых текстовых документов, где данные изображения сжимаются чрезвычайно эффективно.
Сканирование содержит ненужные или пустые страницы
Сканеры с автоматическими податчиками документов иногда пропускают лишние пустые страницы, особенно если у документа пустая обратная сторона. Каждая пустая страница по-прежнему сохраняется как полное изображение в PDF, увеличивая размер файла без добавления какого-либо полезного контента. Сканирование 20 страниц с 6 случайно пустыми страницами на 30 % больше, чем нужно.
После сканирования быстро просмотрите PDF и удалите все пустые или повторяющиеся страницы перед сохранением или публикацией. Большинство инструментов PDF позволяют удалять отдельные страницы — это занимает около 30 секунд и может значительно уменьшить окончательный размер.
Как уменьшить размер существующего отсканированного файла PDF
Если сканирование уже выполнено и файл слишком велик, у вас есть два основных варианта: сжать его или повторно отсканировать с лучшими настройками. Повторное сканирование — более чистое решение, если у вас все еще есть доступ к физическому документу и вы хотите получить наилучший результат. Но если вам просто нужно быстро уменьшить размер файла до предела, сжатие работает хорошо.
Инструмент PDF Compression компании WukongPDF хорошо обрабатывает отсканированные файлы PDF, поскольку он напрямую оптимизирует встроенные изображения — именно из этого и состоит отсканированный PDF. Загрузите файл, выберите уровень сжатия и загрузите результат. Для типичного отсканированного текстового документа результат обычно на 70–85 % меньше оригинала без видимой потери качества.
Настройки сканирования для дальнейшего использования
Несколько изменений в настройках сканера обеспечат возможность управления файлами с самого начала:
- Текстовые документы: черно-белый режим, 150 точек на дюйм.
- Документы с фотографиями или графикой: оттенки серого или цветные, 200 точек на дюйм.
- Архивирование оригиналов, которые могут потребоваться для воспроизведения: 300 точек на дюйм, цвет, если применимо.
- Всегда включайте сжатие PDF в программном обеспечении сканера, если эта опция доступна.
Отсканированные файлы PDF не обязательно должны быть большими. Правильные настройки во время сканирования сохраняют размер файлов без ущерба для действительно необходимого качества, а этап сжатия постфактум обрабатывает все, что проскользнуло.
Попробуйте сжать PDF
Никакой установки не требуется. Работает прямо в вашем браузере.
