您刚刚扫描了一堆文档(十页,也许二十页),生成的 PDF 为 45MB。它需要进入具有 25MB 限制的电子邮件,或进入具有严格文件大小要求的提交门户。扫描完成,文档存在,现在您需要将其缩小而不使其无法阅读。以下是具体的处理方法。

为什么扫描的 PDF 一开始就这么大
扫描的 PDF 将每一页存储为高分辨率照片。与从 Word 文档创建的 PDF(其中文本存储为高效字符数据并且图像被压缩)不同,扫描的 PDF 本质上是包装在 PDF 容器中的一堆图像。在扫描仪默认设置下,每个页面图像可以是几兆字节。
大多数扫描仪默认为 300 DPI 彩色扫描,这适合归档重要文档,但生成的文件比仅在屏幕上阅读或提交到门户的文档所需的文件大得多。以 300 DPI 颜色扫描的十页文档很容易达到 30-50MB。以 150 DPI 灰度扫描的同一文档通常为 3-8MB — 可读、可提交,并且是原始大小的一小部分。
尝试压缩 PDF
无需安装。直接在您的浏览器中工作。
最快的修复:通过压缩机运行它
在大多数情况下,从超大的 Scanned PDF 到可提交的最快路径是基于浏览器的压缩工具。位于 www.wukongpdf.com 的 WukongPDF 的 PDF 压缩 工具可处理扫描文档 - 上传文件,选择中度或高度压缩,下载结果。
扫描文档的每个压缩级别的预期结果:
- 低压缩:大小减少10-30%。文本保持清晰,图像几乎不受影响。当质量是优先考虑而尺寸减小是次要的时候,这是很好的选择。
- 中度压缩:尺寸减小40-70%。文本仍然可读,图像显示出轻微的软化,这在正常阅读尺寸下并不明显。对于大多数提交来说都是正确的选择。
- 高压缩:尺寸减少60-85%。文本仍然清晰,但图像明显退化。对于内部文档或草稿来说是可以接受的,但对于要打印或仔细检查的任何内容来说并不理想。
压缩后,打开结果并滚动浏览,然后提交。检查每个页面上的文本是否仍然可读 - 特别注意带有小字体、密集表格或手写元素的页面,这些页面最先受到剧烈压缩的影响。
转换为灰度以进一步减少
彩色图像数据明显比灰度数据重。彩色扫描为每个像素存储三个颜色通道(红、绿、蓝);灰度扫描存储一个。对于文本较多的文档(打字的信件、表格、打印的报告),颜色信息通常是无关紧要的:文档的灰度看起来与彩色看起来基本相同。
与单独压缩彩色版本相比,在压缩之前或期间将彩色扫描转换为灰度可以将文件大小额外减少 50-60%。这对于没有有意义的彩色内容的文档(打印的页面、打印的表格、黑白照片)最有效。不要将其用于颜色携带信息的文档 - 医学成像、具有颜色编码元素的工程图或读者需要区分颜色的任何文档。
如果可以重新扫描:首先调整设置
如果原始文档仍然可以访问并且扫描刚刚完成,那么值得花两分钟调整扫描仪设置并重新扫描,而不是在事后尝试压缩超大文件。结果将比高度压缩的高分辨率扫描更小、更干净。
- 仅用于屏幕: 以 150 DPI 灰度扫描。在任何屏幕上均可读取,文件很小。
- 对于可以打印的文档:以 200-300 DPI 灰度扫描。良好的打印质量,没有色彩开销。
- 出于存档目的:以 300 DPI 颜色扫描,并将全分辨率存档副本与压缩共享副本分开。
还有一个值得采取的步骤:使其可搜索
当您打开文件并正在处理它时,请考虑对其运行 OCR 以使文本可搜索。还可以搜索的压缩扫描 PDF 比较小的文件更有用。您可以在其中搜索特定文本,从中复制文本,它将按内容而不是仅按文件名显示在文件系统搜索中。 www.wukongpdf.com 上的 WukongPDF 的 OCR 工具可以处理此问题 - 这是与压缩不同的步骤,但需要相同的时间并永久提高文档的可用性。
尝试压缩 PDF
无需安装。直接在您的浏览器中工作。
