Когда вы сжимаете PDF, инструмент применяет один из двух принципиально разных подходов в зависимости от типа контента, который он обрабатывает. Сжатие с потерями и сжатие без потерь — это не просто разные настройки — это разные операции с разными эффектами и разными компромиссами. Понимание этого различия объясняет, почему сжатие текстового документа и сжатие брошюры с большим количеством фотографий дают такие разные результаты.

Сжатие без потерь: меньше, ничего не удаляя
Сжатие без потерь уменьшает размер файла за счет обнаружения и устранения избыточности в данных — шаблонов, которые можно описать более эффективно, не отбрасывая никакой информации. Распакованный вывод математически идентичен оригиналу. Ничего не потеряно, не изменено и не приближено.
Простая аналогия: вместо написания «ААААААААА»; в файле вы пишете «9×A». Информация та же самая — девять А — но ее хранение более эффективно. Реальные алгоритмы сжатия более сложны, но принцип тот же: найдите шаблоны, которые можно представить меньшим количеством байтов, не теряя при этом того, что они представляют.
В файлах PDF сжатие без потерь применяется к тексту, векторной графике и структурным данным. Вот почему сжатие насыщенного текстом PDF не приводит к видимым изменениям качества — текст сжимается без потерь, что означает, что каждый символ сохраняется идеально. Стандарт PDF использует такие форматы, как ZIP/Deflate и LZW, для сжатия этих типов контента без потерь.
Попробуйте сжать PDF
Никакой установки не требуется. Работает прямо в вашем браузере.
Сжатие с потерями: меньше за счет исключения данных
Сжатие с потерями позволяет добиться меньших размеров файлов за счет постоянного отбрасывания данных, которые алгоритм считает менее важными — обычно информации, к которой человеческое восприятие менее чувствительно. Для изображений это означает тонкие изменения цвета в плавных градиентах, мелкие детали в областях с низкой контрастностью и высокочастотную визуальную информацию, которую труднее воспринимать.
JPEG — наиболее известный формат сжатия с потерями. Когда изображение JPEG сжимается, алгоритм делит изображение на блоки размером 8×8 пикселей и упрощает информацию о цвете внутри каждого блока. При низких уровнях сжатия упрощение незаметное. При высоких уровнях сжатия границы блоков становятся видимыми как характерные блочные артефакты JPEG.
Важно отметить, что сжатие с потерями является постоянным. Если данные удалены, их невозможно восстановить. Изображение, сильно сжатое в формате JPEG, можно распаковать, но недостающие детали не вернутся — вы получите приближение, а не оригинал. Вот почему PDF Сжатие в документе с большим количеством изображений следует выполнять только для копии с сохранением оригинала.
Как PDF использует оба типа одновременно
Один PDF обычно содержит несколько типов контента, и сжатие к каждому применяется по-разному:
- Текстовая и векторная графика: всегда без потерь. Символы, линии и фигуры сжимаются без потери данных.
- Фотографии: обычно с потерями (JPEG). Уровень сжатия определяет, какой объем данных изображения будет отброшен.
- Скриншоты и графика с резкими краями: иногда без потерь (ZIP или JBIG2 для черно-белых изображений), иногда с потерями в зависимости от инструмента создания PDF и настроек.
- Структура документа и метаданные: всегда без потерь. Структурная целостность PDF должна быть точно сохранена.
Вот почему инструмент сжатия PDF может значительно уменьшить размер отсканированной брошюры с большим количеством фотографий, оказывая при этом минимальное влияние на текстовый контракт — брошюра содержит много графических данных, сжимаемых с потерями, в то время как контракт почти полностью представляет собой текст, сжатый без потерь.
Что такое «Уровень сжатия»? На самом деле контролирует
Когда интерфейс сжатия PDF Tools предлагает низкие, средние и высокие настройки сжатия, он регулирует агрессивность сжатия с потерями, применяемого к изображениям. Сжатие без потерь выполняется с максимальной эффективностью независимо от настроек — единственная значимая переменная — это то, насколько качеством приходится жертвовать при сжатии изображения с потерями.
- Низкий: изображения сжимаются с минимальной потерей качества — аналогично качеству JPEG 85–90.
- Среднее: изображения сжаты с умеренной потерей качества — аналогично качеству JPEG 70–80.
- Высокий: изображения сжимаются агрессивно — аналогично качеству JPEG 50–60, при котором становятся видны артефакты.
Для большинства повседневных задач совместного использования PDF — сжатия отчета перед отправкой по электронной почте, уменьшения размера презентации для загрузки — средний уровень сжатия обеспечивает правильный баланс. Текст остается идеальным (без потерь), изображения остаются визуально чистыми, а размер файла уменьшается настолько, что это имеет значение. Инструмент Reduce PDF Size от WukongPDF на www.wukongpdf.com применяет этот подход — выберите уровень, который соответствует вашему варианту использования, и загрузите файл меньшего размера, не выглядя хуже.
Попробуйте сжать PDF
Никакой установки не требуется. Работает прямо в вашем браузере.
