简短的答案是:使用一种以不同方式压缩不同类型内容的工具,并从原始文件开始工作。但这个总结跳过了真正决定你的 PDF 是否看起来不错的部分 - 这就是理解什么是“质量”。表示您的特定文档,以及文件大小的实际来源。

为什么 PDF 压缩不是一刀切的
PDF 不是单一类型的内容 - 它是一个可以容纳文本、矢量图形、光栅图像、字体、元数据、嵌入文件等的容器。这些元素中的每一个对压缩的响应都不同。文本和矢量图形可以无损压缩,这意味着您可以减小文件大小,而无需进行任何明显的更改。光栅图像(照片、扫描页面、屏幕截图)需要不同的方法,因为它们已经是压缩数据,必须权衡重新压缩。
对所有内容应用单一压缩算法的工具将 PDF 视为 ZIP 文件 - 均匀地压缩整个内容。这可以减少整体文件大小,但如果算法对图像的打击太大,可能会损害图像质量。更好的工具可以区分内容类型并适当地处理每一种内容。
尝试压缩PDF
无需安装。直接在您的浏览器中工作。
文件大小实际存在的地方
对于大多数 PDF,文件大小的大部分来自两个位置之一:嵌入图像或嵌入字体。主要是文本的 10 页报告可能有 200KB。包含一些高分辨率照片的同一份报告可能有 15MB。扫描文档本质上只是图像 - 每一页都是纸质照片 - 这就是扫描的 PDF 往往如此之大的原因。
字体也可以做出重大贡献,特别是如果 PDF 嵌入完整的字体文件而不是子集。使用五种不同字体并为每种字体嵌入完整字体文件的 PDF 可以在单个单词内容之前添加几兆字节。大多数现代 PDF 工具会自动对字体进行子集化 - 仅嵌入实际使用的字符 - 但较旧的文件或从某些软件导出的文件并不总是这样做。
文档类型的正确压缩方法
文本较多的文档(报告、合同、带有最少照片的演示文稿):
无损压缩可以很好地处理这些问题。文件大小显着减小,并且没有明显的质量损失,因为文本和矢量图形可以干净地压缩而不会出现任何质量下降。
图片较多的文档(产品目录、照片组合、营销材料):
这就是质量权衡发生的地方。 80-85% 质量的 JPEG 压缩通常肉眼看不到,但图像文件大小会减少 40-60%。低于 70% 时就会开始出现可见的伪影。对于图像质量很重要的文档(产品照片、任何可能打印或缩放的内容),请勿将压缩率降低到 75% 以下。
扫描文档:
这些压缩效果很好,因为大部分图像都是空白。在保持文本完全清晰的设置下,应用于扫描文本文档的PDF压缩通常可以将文件大小减少70-80%。关键是压缩器应该将这些识别为文档图像而不是照片,并应用适合文档的压缩。
损害质量的常见错误
产生模糊或损坏的 PDF 的错误通常是以下之一:
- 压缩已经压缩的文件。每次重新压缩 JPEG 图像时,都会压缩压缩数据 — 质量会逐渐下降。始终回到最初的源头。
- 追求的目标文件大小太小。如果有人设置了 500KB 的限制,而您的 PDF 有 10 张高分辨率照片,则必须做出一些让步。对在不损失质量的情况下可以进行多少压缩设定切合实际的期望。
- 使用 print-to-PDF 作为压缩方法。有些人使用 PDF 打印机进行打印,希望缩小尺寸。这通常会生成较大的文件,而不是较小的文件,并且会丢失扫描文档中的文本层。
在压缩工具中寻找什么
一个好的PDF压缩工具至少可以让您对图像质量设置进行一些控制,自动对文本和矢量应用无损压缩,并且无需安装软件即可进行处理。 WukongPDF 的压缩工具可以完成这三个任务:上传、选择质量级别、下载。对于大多数文档,默认设置可以在文件大小减小和视觉质量之间达到适当的平衡,无需任何调整。
压缩后,请务必在发送前打开结果并在几页上缩放至 150% 以检查清晰度。只需 30 秒的检查即可在质量问题到达收件人之前发现它们。
尝试压缩PDF
无需安装。直接在您的浏览器中工作。
