截取屏幕截图并将其另存为 PDF 听起来是一种捕获内容的快速方法。对于单个图像来说效果很好。作为创建文档的工作流程(电子表格的屏幕截图、网页的屏幕截图、其他 PDF 的屏幕截图),它生成的文件具有严重的实际限制,除非您尝试对它们执行一些有用的操作,否则这些限制并不明显。以下是出现问题的地方以及应该采取的措施。

基于屏幕截图的 PDF 实际上包含什么
由屏幕截图制作的 PDF 是一个包含一张或多张图像的容器。没有文本层,没有文档结构,没有关于内容含义的元数据。屏幕截图中可见的单词仅以像素形式存在——排列成看起来像字母的彩色点。该文档的语义内容并不比页面照片更多。
这种区别——真实的文本与看起来像文本的像素——是接下来的每个问题的根本原因。 PDF 屏幕截图中的 PDF 质量 问题并不是 PDF 格式的失败;而是 PDF 格式的问题。这是在需要文档格式的情况下使用图像格式的基本限制。
尝试 PDF OCR
无需安装。直接在您的浏览器中工作。
你无法搜索
在屏幕截图 PDF 中按 Ctrl+F,搜索什么也没找到。页面上可见的文本不作为可搜索内容存在。如果您要创建研究文章、数据表或稍后需要引用的任何文档的 PDF,则无法在其中进行搜索是一个重大的实际限制。
该文件也不会出现在操作系统按内容搜索中——仅按文件名搜索。屏幕截图 PDFs 的文件夹只能按照您的命名约定进行导航,而无需搜索您记得在文档中的单词。
质量下降 — 并且无法恢复
屏幕截图以屏幕分辨率捕获内容 - 标准显示器上通常为 72 到 96 DPI。用于阅读或打印的 PDF 文档应至少为 150 DPI;任何高质量打印都需要 300 DPI。屏幕截图 PDF 低于可靠打印质量的最低阈值,如果随后压缩 PDF,问题会更加复杂。
在 100% 缩放下在屏幕上看起来可以接受的文本在打印或放大时通常看起来明显像素化。表格中的数字(对于准确阅读尤其重要)在低分辨率下可能会变得模糊。 “6”和“8”在原始分辨率下可区分的内容在压缩屏幕截图 PDF 中可能看起来相同。
您无法从中复制文本
如果没有 OCR,则无法从屏幕截图 PDF 中选择和复制图形、引言、条款或任何其他内容。文本光标要么不会出现,要么会选择整个图像作为一个块。任何收到文档并需要从中提取任何内容(将引用粘贴到报告中、将数字复制到电子表格中)的人都将面临手动重新输入。
对于您为其他人创建的文档(数据表、参考文档、研究摘要),此限制会显着降低文档的实用性。带有真实文本的 PDF 是协作性的;屏幕截图 PDF 从字面意义上来说是只读的。
它不符合可访问性要求
屏幕阅读器 - 视力障碍人士使用的软件 - 通过阅读文档的文本内容来工作。屏幕截图 PDF 没有文本内容。屏幕阅读器宣布文档已打开,然后没有任何内容可供阅读。在文档需要满足可访问性标准的专业或公共部门环境中,屏幕截图 PDF 无法满足所有适用的要求。这不是一个小问题——在许多司法管辖区,在可访问的替代方案可行的情况下分发不可访问的文档是一个合规问题。
除了截图之外还能做什么
正确的方法取决于您想要捕获的内容:
- 捕获网页:使用浏览器内置的打印>另存为 PDF 功能,或首先使用阅读器模式以获得更清晰的输出。结果包含真实文本,而不是像素。
- 捕获电子表格:使用“文件”>“直接从 Excel 或 Google Sheets 导出”下载>> PDF。结果是格式正确的 PDF,具有正确分辨率的真实文本。
- 捕获另一个PDF:使用拆分工具提取所需的页面,而不是对其进行屏幕截图。提取的页面保留其原始分辨率和文本层。
- 存档中已包含屏幕截图 PDF: 通过 www.wukongpdf.com 上 WukongPDF 的 OCR PDF 工具运行它们,以添加可搜索文本层。它不会恢复打印质量分辨率,但它使内容可搜索和可复制。
屏幕截图有其地位——只是不像文档
屏幕截图对于捕获视觉状态非常有用 - 屏幕在某个时刻的样子、UI bug、设计参考。对于创建文档记录、参考资料或任何需要搜索、复制、高质量打印或由使用辅助技术的人员访问的内容来说,它们是错误的工具。对于这些类别中的任何内容,请使用源应用程序的导出功能,而不是屏幕截图快捷方式。
尝试 PDF OCR
无需安装。直接在您的浏览器中工作。
