PDF 文件可以包含两种根本不同类型的视觉内容:光栅和矢量。大多数 PDF 都包含两种内容:存储为光栅图像的照片、存储为矢量数据的文本和图表。了解这种差异可以解释为什么有些 PDF 在任何缩放级别下看起来都很清晰,而另一些则变得像素化,为什么有些文件很大而另一些文件很小,以及为什么某些内容无法编辑而其他内容可以精确修改。

光栅内容:像素网格
光栅内容由像素组成 - 彩色点的固定网格。嵌入 PDF 中的照片是光栅:每个像素都有特定的颜色值,它们一起形成图像。栅格内容的关键特征是它具有固定的分辨率。在 300 DPI 下,按预期尺寸打印时,光栅图像看起来很清晰。将其放大到 200%,分辨率只有一半 — 像素变成可见的正方形,图像看起来模糊。
扫描的 PDF 完全是光栅——每一页都是一张照片。这就是为什么 Scanned PDF 文件很大(大量像素数据)、无法搜索(没有文本,只是排列成看起来像字母的彩色点)并且在大幅放大时看起来像素化的原因。您看到的 PDF 质量 直接取决于捕获扫描的 DPI。
尝试编辑 PDF
无需安装。直接在您的浏览器中工作。
矢量内容:数学描述
矢量内容是通过数学公式而不是像素来定义的。矢量图形中的线被描述为“起始于坐标(10, 20),结束于(150, 20),笔划宽度2pt,颜色黑色”。 — 不是一排黑色像素。数字 PDF 中的文本是矢量:每个字符都是由曲线和坐标定义的数学形状,而不是像素位图。
由于矢量内容是通过数学定义的,因此它可以完美缩放到任何大小。将数字 PDF 中的文本放大到 1000%,它仍然保持完美清晰度 - 渲染器会以新尺寸重新计算曲线。将其打印在广告牌或名片上,同样清晰。对于在 Illustrator 等矢量工具中创建的徽标、图表和图表或从生成矢量 PDF 输出的应用程序导出的徽标、图表和图表也是如此。
典型的PDF如何混合两种类型
典型的商业 PDF — 报告、演示文稿、手册 — 同时包含这两种类型。文本是矢量(任何大小都清晰、存储紧凑、可搜索)。在源应用程序中创建的图表和图表可能是矢量。从网络复制的照片和图像是光栅。图标和徽标可能是其中之一,具体取决于它们的创建和嵌入方式。
这就是为什么放大 PDF 页面会显示清晰的文本和清晰的线条艺术,但照片却模糊 - 文本和图表是矢量,而照片是其嵌入分辨率的光栅。这也是为什么当存在图像时压缩 PDF 会显着减小文件大小,但几乎不会影响文本较多的 PDF — 您压缩的是光栅像素数据,而不是矢量数学描述。
为什么这在实践中很重要
- 打印质量:矢量内容在任何尺寸下都能清晰打印。仅当其嵌入的分辨率足以满足打印尺寸时,光栅内容才能很好地打印 - 以全页尺寸打印的 72 DPI 网页图像看起来很模糊。
- 文件大小:矢量内容紧凑 - 存储为矢量的复杂图表可能只有几千字节。与 300 DPI 下的光栅图像相同的图表可能有几兆字节。在 PDF 中用矢量等效物替换光栅图像可显着减小文件大小。
- 可编辑性:可以选择、复制和编辑 PDF 中的 矢量文本(使用正确的工具)。光栅文本只是像素 - 如果没有 OCR 处理就不可能选择单个单词。
- 压缩行为: PDF 压缩 主要影响光栅图像。矢量内容的压缩程度最低,因为它在数学上已经是高效的。在压缩下不会收缩太多的 PDF 可能主要是矢量内容。
如何判断您正在查看的内容类型
缩放测试是明确的:在任何 PDF 查看器中,将相关内容放大至 400-500%。如果它保持完全清晰——边缘清晰,没有可见的像素化——它就是矢量。如果像素变得可见为正方形或图像变软和模糊,则它是光栅。
特别是对于文本:如果您可以单击它并选择单个单词,那么它就是矢量文本。如果单击选择整个页面作为图像块,则文本是光栅 - 它仅作为页面图像中的像素存在,而不是作为实际文本数据。这与用于确定 PDF 编辑器 是否可以处理内容或是否首先需要 OCR 的测试相同。
尝试编辑 PDF
无需安装。直接在您的浏览器中工作。
