2026 年 2 月 17 日,Google 在其 Document AI 发行说明中悄悄发布了弃用通知。该消息是技术性的且简短的:一批旧处理器(其中一些可以追溯到 2020 年和 2021 年)将于 2026 年 6 月 30 日停止工作。使用它们的开发人员需要在此日期之前进行迁移,否则将面临服务故障。
对于大多数日常使用 PDF 的人来说,此通知毫无意义。但它实际上是一个有用的窗口,可以了解 PDF OCR 和文档处理背后的技术的发展速度有多快,以及这种转变对任何处理文档的人意味着什么。

实际被关闭的内容
Google Document AI 是一项云服务,可以自动读取、解释和提取文档中的信息。企业使用它来大规模处理纳税表格、银行对账单、发票和抵押文件等内容——输入 PDF,输出结构化数据。
即将退役的处理器包括各种专用工具:护照和驾驶执照的身份解析器、W-9 和 1099 的税表解析器、抵押贷款报表工具、公用事业账单解析器和文档分割模型。其中最古老的建于 2020 年。其中一些最后更新于 2021 年或 2022 年。
Google 推荐的替代品均在较新的模型上运行 - Enterprise Document OCR v2.1、更新的发票和费用解析器以及由 Gemini 提供支持的自定义提取器。旧处理器的功能与新处理器的功能之间存在巨大差距,而这种差距正是谷歌强制转换的原因。
尝试 PDF OCR
无需安装。直接在您的浏览器中工作。
为什么 Gemini 改变了文档处理的数学原理
最初的文档 AI 处理器的工作方式与大多数 OCR 一贯的工作方式相同:它们经过训练可以识别特定的文档布局。输入 W-9 表单,从该表单中获取特定字段。对于具有可预测格式的结构化文档来说,它足够准确,但很脆弱——即使稍微改变布局,准确性也会下降。
替代处理器以 Gemini 作为基础。他们不再被锁定在固定的模板上,而是更像一个人一样理解文档——阅读上下文、处理变化、识别字段的含义而不仅仅是它在页面上的位置。 Google 的 Layout Parser v1.6 于 2026 年 1 月发布,基于 Gemini 3 Flash 构建,现在可以识别和描述解析文档中的图像和表格,这是传统工具根本无法做到的。
从谷歌的角度来看,让旧处理器与新处理器一起运行只是技术债务。新模型可以更好地完成相同的工作,无限期地维护两个并行系统是没有意义的。
此发送的有关文档 AI 走向的信号
这些处理器的退役不仅仅是一项清理任务。它标志着更有意义的事情:第一代人工智能驱动的文档工具在推出不到五年后就已经过时了。
这是一个快速的循环。它指出了事情的发展方向。 2026 年的文档人工智能不再是真正的阅读页面上的文本。较新的系统可以理解文档结构、交叉引用字段、处理具有复杂布局的多页文档,并且可以针对特定行业进行微调,而无需从头开始重建。在 Gemini 上运行的自定义提取器可以指向新的文档类型,并开始以最少的设置提取有用的数据 - 这在几年前需要花费数月的标记训练数据。
对于任何在这些平台上构建的人来说,实际意义是:当今最前沿的技术的保质期比以前更短。更新换代的步伐正在加快。
如果您只使用 PDFs 这意味着什么
如果您不是开发者,也不在运行 Google Cloud 基础架构的公司工作,那么 6 月 30 日的截止日期不会对您产生直接影响。但潜在的转变以更实际的方式重要。
使企业文档处理性能显着提高的技术也开始出现在日常PDF 工具 中。在扫描的 PDF 中进行搜索、自动从表单中提取数据或将拍摄的收据转换为可编辑文本的能力 - 这些功能过去需要昂贵的软件或云服务。每隔几个月,为它们提供动力的模型就会变得更便宜、速度更快。
这实际上意味着什么:对于日常用例来说感觉有点大材小用的工具正在变得可以达到大多数人实际需要的水平。如果您曾经尝试从扫描的 PDF Conversion 中提取文本并得到一堆乱码,那么这种体验与现在可能的情况之间的差距是巨大的。
您不需要企业工具即可获得企业级质量的结果
谷歌退役其遗留处理器本质上是谷歌承认标准已经发生了变化。他们在 2020 年和 2021 年构建的工具不再足够好——不是因为它们坏了,而是因为现在可能的东西要好得多,保留旧版本会带来更多混乱而不是价值。
对于日常文档工作来说,这种技术循环的好处在于它可以进行过滤。 WukongPDF 就属于这个领域,它是一个基于浏览器的工具,可处理大多数人实际需要的 PDF 工作流程 任务:转换、压缩、合并、编辑 - 无需企业基础设施或开发人员进行设置。底层技术不断改进,使用它的工具也随之变得更好。
谷歌声明的要点并不是你需要担心处理器版本。文档技术正处于多年来最快的改进周期之一,普通用户可用的工具现在比以往任何时候都更好。
尝试 PDF OCR
无需安装。直接在您的浏览器中工作。
