Others

PDF 元数据:它是什么以及为什么重要

每个 PDF 所携带的信息超出了其页面上可见的范围。这个隐藏层(称为元数据)包括有关文档来源、作者、创建和修改时间、制作软件的详细信息,有时甚至更多。大多数人从来不看它。但它始终存在,并且无论文件走到哪里,它都会随文件一起移动。

PDF Metadata: What It Is and Why It Matters

PDF 元数据包含什么

标准 PDF 元数据字段包括:

  • Title:文档标题,可能与文件名不同
  • 作者:创建文档的人的姓名,从软件的用户设置中提取
  • 主题和关键字:可搜索的可选描述字段
  • Creator:创建原始文档的应用程序 - Microsoft Word 365、Google Docs、InDesign 等。
  • 制作者:转换或生成PDF的软件 — Adob​​e PDF Library、macOS Quartz 等。
  • 创建日期和修改日期:时间戳显示文档最初创建和最后更改的时间
  • XMP 元数据: 是一种嵌入在许多 PDF 中的扩展元数据格式,特别是那些通过设计软件创建的文件。可以包括版权信息、照片中的 GPS 坐标、相机设置等。
WukongPDF

尝试编辑 PDF

无需安装。直接在您的浏览器中工作。

立即开始 →

如何查看PDF的元数据

在 Adob​​e Reader 或 Acrobat 中,转到“文件”>“属性(Windows 上为 Ctrl+D,Mac 上为 Cmd+D)。描述选项卡显示标准元数据字段。 “其他元数据”按钮可打开完整的 XMP 元数据查看器以获取更多详细信息。

在 Mac 上,右键单击 Finder 中的 PDF 并选择获取信息会显示基本元数据。在 Windows 资源管理器中,右键单击并选择属性 >详细信息显示了一些元数据字段。要完整查看任何 PDF 中的所有元数据,Adobe Acrobat Pro 的文档属性面板是最全面的选择。

为什么元数据在实践中很重要

对于大多数文档来说,元数据是良性的背景信息。但在某些情况下它变得很重要:

  • 隐私披露:作者字段可能会显示谁创建了旨在显示为匿名或无作者的文档。某些元数据中的文件路径可能会暴露创建计算机的内部文件夹结构、服务器名称或用户名。
  • 揭示草稿历史记录:创建和修改日期显示文档的制作时间。提案在发送前三个小时加上时间戳,表明它是仓促准备的——这对于客户的感知来说并不理想。一份日期为据称描述的事件之后的文件引发了疑问。
  • 软件指纹识别:创建者和生产者字段显示使用了什么软件。一份声称是官方表格但显示它是在基本消费者工具中创建的文件可能会引起可信度问题。
  • 法律发现:在诉讼中,文档中的元数据可以作为证据。在文件真实性存在争议的法律案件中,修改日期、作者姓名和修订历史非常重要。

如何编辑或删除PDF元数据

在 Adob​​e Acrobat Pro 中,文件 >属性允许您直接编辑标准元数据字段 - 更改作者姓名、清除标题、修改主题。清理文档功能(工具 > 编辑 > 清理文档)可以更彻底地删除元数据,包括 XMP 数据和隐藏信息。

无需 Acrobat Pro 即可使用的更简单方法:使用操作系统的内置 PDF 打印机将 PDF 打印为新的 PDF。这将创建一个没有原始文档元数据跟踪的新文件 - 新 PDF 的创建日期是今天,作者字段为空或设置为系统默认值,并且软件指纹反映 PDF 打印机而不是原始应用程序。使用 PDF 编辑器 进行有针对性的编辑,或使用打印到 PDF 方法进行清理。

什么时候元数据值得保留

元数据并不总是一种责任。对于内部档案,元数据使文档可以按作者、日期和主题进行搜索。对于官方记录,准确的时间戳和作者信息支持文档的真实性。出于 PDF Archive 的目的,丰富的元数据使馆藏在数年后仍可导航。问题是元数据是否为您服务,或者暴露了您不想共享的内容 - 答案取决于文档的去向以及谁将接收它。

WukongPDF

尝试编辑 PDF

无需安装。直接在您的浏览器中工作。

立即开始 →