Файл PDF может содержать два принципиально разных типа визуального контента: растровый и векторный. Большинство PDF содержат и то, и другое — фотографии, хранящиеся в виде растровых изображений, текст и диаграммы, хранящиеся в виде векторных данных. Понимание разницы объясняет, почему некоторые PDF-файлы выглядят четкими при любом уровне масштабирования, в то время как другие становятся пикселизированными, почему некоторые файлы большие, а другие крошечные, и почему определенный контент не поддается редактированию, в то время как другой контент можно точно изменить.

Растровый контент: сетки пикселей
Растровый контент состоит из пикселей — фиксированной сетки цветных точек. Фотография, встроенная в PDF, является растровой: каждый пиксель имеет определенное значение цвета, и вместе они образуют изображение. Ключевой характеристикой растрового контента является то, что он имеет фиксированное разрешение. При разрешении 300 точек на дюйм растровое изображение выглядит четким при печати в заданном размере. Увеличьте его до 200 %, и вы получите половину разрешения — пиксели становятся квадратиками, изображение выглядит размытым.
Отсканированные файлы PDF полностью растровые: каждая страница представляет собой фотографию. Вот почему Отсканированные файлы PDF имеют большой размер (много пиксельных данных), не могут быть найдены (нет текста, только цветные точки, расположенные в виде букв) и выглядят пикселизированными при значительном увеличении. Качество PDF, которое вы видите, напрямую зависит от разрешения, с которым было выполнено сканирование.
Попробуйте «Редактировать PDF»
Никакой установки не требуется. Работает прямо в вашем браузере.
Векторное содержимое: математические описания
Векторное содержимое определяется математическими формулами, а не пикселями. Линия в векторной графике описывается как «начинается в координате (10, 20), заканчивается в (150, 20), ширина обводки 2 пт, цвет черный». — не как ряд черных пикселей. Текст в цифровом PDF является векторным: каждый символ представляет собой математическую форму, определяемую кривыми и координатами, а не растровое изображение пикселей.
Поскольку векторное содержимое определяется математически, оно идеально масштабируется до любого размера. Увеличьте масштаб текста в цифровом PDF до 1000 %, и он останется идеально четким — средство рендеринга пересчитывает кривые в новом размере. Распечатайте его на рекламном щите или визитной карточке, и он будет таким же четким. То же самое относится и к логотипам, диаграммам и диаграммам, созданным с помощью векторных инструментов, таких как Illustrator, или экспортированным из приложений, генерирующих векторный вывод PDF.
Как типичный PDF сочетает в себе оба типа
Типичный деловой PDF — отчет, презентация, брошюра — содержит оба типа одновременно. Текст векторный (четкий в любом размере, компактный для хранения, с возможностью поиска). Диаграммы и диаграммы, созданные в исходном приложении, могут быть векторными. Фотографии и изображения, скопированные из Интернета, являются растровыми. Значки и логотипы могут быть любыми, в зависимости от того, как они были созданы и внедрены.
Вот почему при увеличении масштаба страницы PDF отображается четкий текст и четкие штриховые рисунки, но размытые фотографии: текст и диаграммы являются векторными, а фотографии — растровыми во встроенном разрешении. Именно поэтому сжатие PDF значительно уменьшает размер файла при наличии изображений, но практически не влияет на текстовые PDF — вы сжимаете растровые пиксельные данные, а не векторные математические описания.
Почему это важно на практике
- Качество печати: векторное содержимое печатается четко в любом размере. Растровый контент печатается хорошо только в том случае, если его встроенное разрешение достаточно для размера печати — веб-изображение с разрешением 72 DPI, напечатанное на полный размер страницы, выглядит размытым.
- Размер файла: Векторное содержимое компактно — сложная диаграмма, хранящаяся в векторном виде, может занимать несколько килобайт. Та же диаграмма, что и растровое изображение с разрешением 300 DPI, может занимать несколько мегабайт. Замена растровых изображений векторными эквивалентами в PDF значительно уменьшает размер файла.
- Редактирование: векторный текст в PDF можно выбирать, копировать и редактировать (с помощью подходящих инструментов). Растровый текст — это всего лишь пиксели — выделение отдельных слов невозможно без обработки OCR.
- Поведение сжатия: PDF Сжатие в первую очередь влияет на растровые изображения. Векторный контент сжимается минимально, поскольку он уже математически эффективен. PDF, который не сильно сжимается при сжатии, скорее всего, в основном представляет собой векторный контент.
Как определить, какой тип контента вы просматриваете
Тест масштабирования является окончательным: в любой программе просмотра PDF увеличьте масштаб рассматриваемого контента до 400–500%. Если он остается идеально резким — края четкие, пикселизация не видна — это вектор. Если пиксели становятся видимыми в виде квадратов или изображение смягчается и размывается, оно растровое.
В частности, для текста: если вы можете щелкнуть по нему и выделить отдельные слова, это векторный текст. Если щелчок выбирает всю страницу как блок изображения, текст является растровым — он существует только в виде пикселей в изображении страницы, а не в виде реальных текстовых данных. Это тот же тест, который используется для определения того, может ли PDF Editor работать с содержимым или сначала требуется распознавание текста.
Попробуйте «Редактировать PDF»
Никакой установки не требуется. Работает прямо в вашем браузере.
