Others

为什么我扫描的 PDF 这么大?

五页信件的扫描版 PDF 不应为 80MB。但情况往往如此,而且原因几乎总是归结为扫描的设置方式,而不是文档本身的任何内容。扫描的 PDF 的文件大小与页面上的文本量无关 - 它完全由扫描仪捕获的图像数据决定。理解这种区别直接指向修复。

Why Is My Scanned PDF So Large?

扫描仪分辨率设置得太高

这是导致扫描的 PDF 尺寸过大的最常见原因。扫描仪分辨率以 DPI(每英寸点数)来衡量。 DPI 越高,捕获的图像数据就越多,生成的文件就越大。许多扫描仪默认为 300 或 600 DPI,这适合归档您可能需要以大幅面打印或近距离放大的文档。对于通过电子邮件共享或上传到门户的标准文本文档来说,这是多余的。

在 300 DPI 下,单个 A4 彩色页面在任何压缩之前会生成大约 25MB 的原始图像数据。将其乘以 10 页文档,在保存 PDF 之前,您的起始大小为 250MB。大多数扫描仪会自动应用压缩,但起点仍然是大量数据。

对于纯文本文档,150 DPI 足以提供干净、可读的输出。对于带有照片或详细图表的文档,200 DPI 是共享目的的合理上限。保存 300+ DPI 以满足真正的归档需求,您稍后可能需要以完整质量复制文档。

WukongPDF

尝试压缩PDF

无需安装。直接在您的浏览器中工作。

立即开始 →

彩色扫描而不是灰度或黑白

彩色扫描为每个像素存储三个数据通道:红色、绿色和蓝色值。灰度扫描仅存储一个。黑白(双色调)扫描每个像素存储一位 - 要么是黑色,要么是白色,没有介于两者之间的任何内容。文件大小的差异很大:纯文本文档的彩色扫描可能比黑白扫描的相同文档大 10-20 倍。

如果您的文档是白纸上的黑色墨水(描述了大多数商业文档、合同和表格),则彩色扫描没有任何好处。扫描将捕获纸张的淡奶油色、订书钉孔附近的灰色阴影以及墨水密度的细微变化,而这些都是您不需要的。在扫描仪设置中切换到黑白或灰度模式可以显着减小文件大小。

保存时未应用压缩

某些扫描仪软件以最小压缩或不压缩的方式保存扫描图像。扫描仪捕获原始图像数据并将其几乎按原样写入 PDF,导致文件相对于其所包含的内容而言不必要地大。这因扫描仪和软件而异 - 有些默认情况下应用积极的压缩,有些则几乎不触及它。

如果您已经有超大的扫描 PDF,则通过 PDF 压缩 工具运行它通常是最快的修复方法。应用于扫描的 PDF 的良好压缩工具可以将文件大小减小 60-80%,而质量没有明显变化 - 特别是对于图像数据压缩效率极高的黑白文本文档。

扫描包含不需要的页面或空白页

带有自动文档进纸器的扫描仪有时会拉出多余的空白页,特别是当文档的背面是空的时。每个空白页面仍然作为完整图像存储在 PDF 中,从而增加文件大小,而不添加任何有用的内容。包含 6 个意外空白页的 20 页扫描件比实际需要的尺寸大 30%。

扫描后,快速查看 PDF 并删除所有空白或重复页面,然后再保存或共享。大多数 PDF 工具都可以让您删除单个页面 - 大约需要 30 秒,并且可以有效地减小最终尺寸。

如何减小现有扫描件的大小 PDF

如果扫描已经完成并且文件太大,您有两个主要选择:压缩它或使用更好的设置重新扫描。如果您仍然可以访问物理文档并希望获得最佳结果,则重新扫描是更干净的解决方案。但如果您只是需要快速使文件低于大小限制,则压缩效果很好。

WukongPDF 的 PDF 压缩 工具可以很好地处理扫描的 PDF,因为它直接优化嵌入图像 - 这正是扫描的 PDF 的组成部分。上传文件,选择压缩级别,然后下载结果。对于典型的扫描文本文档,输出通常比原始文件小 70-85%,并且没有明显的质量损失。

继续使用的扫描设置

对扫描仪设置进行一些更改将使文件从一开始就易于管理:

  • 纯文本文档:黑白模式,150 DPI
  • 带有照片或图形的文档:灰度或彩色,200 DPI
  • 归档您可能需要复制的原件:300 DPI,彩色(如果适用)
  • 如果该选项可用,请始终在扫描仪软件中启用 PDF 压缩

扫描的 PDF 不必很大。扫描时的正确设置可以使文件保持较小的大小,而不会牺牲您实际需要的质量,并且事后的压缩过程可以处理任何漏掉的内容。

WukongPDF

尝试压缩PDF

无需安装。直接在您的浏览器中工作。

立即开始 →