Others

PDF 压缩:有损与无损 — 有什么区别?

当您压缩 PDF 时,该工具会根据其处理的内容类型应用两种根本不同的方法之一。有损压缩和无损压缩不仅仅是不同的设置,它们是具有不同效果和不同权衡的不同操作。了解这种区别就可以解释为什么压缩文本文档和压缩包含大量照片的小册子会产生如此不同的结果。

PDF Compression: Lossy vs Lossless — What's the Difference?

无损压缩:更小而不删除任何东西

无损压缩通过查找和消除数据中的冗余来减小文件大小——可以更有效地描述而不丢弃任何信息的模式。解压缩的输出在数学上与原始输出相同。没有任何内容丢失、改变或近似。

一个简单的类比:不要写“AAAAAAAAA”,而是写“AAAAAAAAA”。在文件中,您写入“9×A”。信息是相同的——九个 A——但存储效率更高。真正的压缩算法更加复杂,但原理是相同的:找到可以用更少字节表示的模式,而不会丢失它们所表示的内容。

在 PDFs 中,无损压缩应用于文本、矢量图形和结构数据。这就是为什么压缩文本较多的 PDF 不会产生明显的质量变化 - 文本是无损压缩的,这意味着每个字符都被完美保留。 PDF 标准使用 ZIP/Deflate 和 LZW 等格式对这些内容类型进行无损压缩。

WukongPDF

尝试压缩 PDF

无需安装。直接在您的浏览器中工作。

立即开始 →

有损压缩:通过丢弃数据来缩小

有损压缩通过永久丢弃算法认为不太重要的数据(通常是人类感知不太敏感的信息)来实现更小的文件大小。对于图像来说,这意味着平滑渐变中的微妙颜色变化、低对比度区域的精细细节以及难以感知的高频视觉信息。

JPEG 是最熟悉的有损压缩格式。压缩 JPEG 图像时,算法将图像划分为 8×8 像素块,并简化每个块内的颜色信息。在低压缩级别下,简化是微妙且不可见的。在高压缩级别下,块边界变得可见,表现为特有的块状 JPEG 伪影。

至关重要的是,有损压缩是永久性的。数据一旦被丢弃,就无法恢复。严重 JPEG 压缩的图像可以解压缩,但丢失的细节不会恢复 - 您得到的是近似值,而不是原始值。这就是为什么对包含大量图像的文档进行 PDF 压缩 只能对副本进行,而保留原始文件。

PDF 如何同时使用两种类型

单个 PDF 通常包含多种内容类型,并且对每种内容类型应用的压缩方式不同:

  • 文本和矢量图形:始终无损。字符、线条和形状都被压缩,不会丢失任何数据。
  • 照片:通常有损 (JPEG)。压缩级别决定了丢弃多少图像数据。
  • 带有锐利边缘的屏幕截图和图形:有时是无损的(ZIP或JBIG2用于黑白),有时是有损的,具体取决于PDF创建工具和设置。
  • 文档结构和元数据:始终无损。必须准确保留 PDF 的结构完整性。

这就是为什么 PDF 压缩工具可以显着减小扫描的包含大量照片的小册子的大小,同时对纯文本合同的影响最小——小册子包含大量有损压缩图像数据,而合同几乎完全是无损压缩文本。

什么是“压缩级别”实际上控制

当 PDF Tools 压缩界面提供低、中和高压缩设置时,它会调整应用于图像的有损压缩的强度。无论设置如何,无损压缩都会以最高效率运行 - 唯一有意义的变量是有损图像压缩中牺牲了多少质量。

  • 低:以最小的质量损失压缩图像 — 类似于 JPEG 质量 85-90
  • 中:以中等质量损失压缩的图像 — 类似于 JPEG 质量 70-80
  • 高:图像被过度压缩 - 类似于 JPEG 质量 50-60,其中伪影变得可见

对于大多数日常 PDF 共享(在发送电子邮件之前压缩报告、减少上传演示文稿),中等压缩可以提供适当的平衡。文本保持完美(无损),图像在视觉上保持干净,文件大小下降到足够重要。 www.wukongpdf.com 上的 WukongPDF 的 Reduce PDF Size 工具应用了这种方法 - 选择适合您的用例的级别并下载较小的文件,但看起来不会更糟。

WukongPDF

尝试压缩 PDF

无需安装。直接在您的浏览器中工作。

立即开始 →