2026 年 2 月 17 日、Google は Document AI リリース ノートに非推奨の通知を密かに掲載しました。メッセージは技術的で簡潔なものでした。レガシー プロセッサのバッチ (一部は 2020 年と 2021 年に遡る) は、2026 年 6 月 30 日に動作を停止します。それらを使用している開発者は、その日までに移行する必要があり、そうしないとサービス障害に直面します。
PDF を日常的に使用するだけのほとんどの人にとって、この通知は何の意味もありません。しかし、これは実際には、PDF OCR とドキュメント処理の背後にあるテクノロジーがどれほど速く進歩しているのか、そしてその変化がドキュメントを扱うすべての人にとって何を意味するのかを知るための有益な手段です。

実際に何がオフになっているのか
Google Document AI は、ドキュメントの情報を自動的に読み取り、解釈し、抽出するクラウド サービスです。企業はこれを使用して、納税フォーム、銀行取引明細書、請求書、住宅ローン書類などを大規模に処理し、PDF を入力し、構造化データを取得します。
廃止されるプロセッサには、パスポートや運転免許証用の ID パーサー、W-9 および 1099 用の納税フォーム パーサー、住宅ローン明細書ツール、公共料金請求書パーサー、文書分割モデルなど、幅広い特殊なツールが含まれます。これらのうち最も古いものは 2020 年に構築されました。いくつかは 2021 年または 2022 年に最後に更新されました。
Google が推奨する代替品はすべて、Enterprise Document OCR v2.1、更新された請求書および経費パーサー、Gemini を搭載したカスタム抽出機能などの新しいモデルで実行されます。古いプロセッサでできることと新しいプロセッサでできることの間には大きなギャップがあり、まさにそのギャップこそが Google が切り替えを強制している理由です。
PDF OCR を試してみる
インストールは必要ありません。ブラウザで直接動作します。
Gemini がドキュメント処理の数学を変えた理由
オリジナルの Document AI プロセッサは、ほとんどの OCR が常に動作してきた方法で動作し、特定のドキュメント レイアウトを認識するようにトレーニングされました。 W-9 フォームにフィードし、そのフォームから特定のフィールドを取得します。予測可能な形式の構造化ドキュメントには十分な精度がありましたが、脆弱でした。レイアウトを少しでも変更すると精度が低下しました。
代替プロセッサは、Gemini を基盤として使用します。固定テンプレートに縛られるのではなく、コンテキストを読み取り、バリエーションを処理し、フィールドがページ上のどこにあるかだけでなくその意味を特定するなど、人間と同じようにドキュメントを理解します。 2026 年 1 月にリリースされ、Gemini 3 Flash 上に構築された Google の Layout Parser v1.6 は、従来のツールでは不可能だった、解析されたドキュメント内の画像と表を識別して記述することができるようになりました。
Google の観点からすると、古いプロセッサを新しいプロセッサと並行して実行し続けることは、単なる技術的負債にすぎません。新しいモデルは同じ仕事をより良く実行し、2 つの並列システムを無期限に維持することは意味がありません。
これが送信する、Document AI の方向性に関するシグナル
これらのプロセッサの廃止は単なる管理作業ではありません。これは、より意味のあることを示しています。AI を活用したドキュメント ツールの第一世代は、発売から 5 年も経たないうちにすでに時代遅れになっています。
それは速いサイクルです。そして、それは物事がどこに向かっているのかを示しています。 2026 年の Document AI は、実際にはページからテキストを読み取ることではありません。新しいシステムは文書構造、相互参照フィールドを理解し、複雑なレイアウトを持つ複数ページの文書を処理し、最初から再構築することなく特定の業界に合わせて微調整できます。 Gemini 上で実行されるカスタム エクストラクターは、新しいドキュメント タイプを指定して、最小限のセットアップで有用なデータの抽出を開始できます。わずか数年前であれば、ラベル付きトレーニング データに何か月もかかっていた作業です。
これらのプラットフォーム上で構築する人にとっての実際的な意味は、今日の最先端のものの保存期間は以前よりも短いということです。置き換えのペースは加速しています。
PDFs だけを操作する場合の意味
あなたが開発者ではなく、Google Cloud インフラストラクチャを実行している会社に勤務していない場合、6 月 30 日の期限は直接影響しません。しかし、根本的な変化はより現実的な意味で重要です。
企業のドキュメント処理を劇的に改善しているのと同じテクノロジーが、日常の PDF ツール にも導入され始めています。スキャンした PDF 内を検索したり、フォームからデータを自動的に取得したり、写真撮影した領収書を編集可能なテキストに変換したりする機能は、以前は高価なソフトウェアまたはクラウド サービスを必要としていました。これらを搭載するモデルは、数か月ごとに価格が安くなり、高速化されています。
これが実際に意味することは、日常的なユースケースでは過剰に感じられたツールが、ほとんどの人が実際に必要とするレベルで利用できるようになってきているということです。スキャンした PDF Conversion からテキストを抽出しようとして、文字化けが発生したことがある場合、その経験と現在可能になっているものの間には大きなギャップがあります。
エンタープライズ品質の結果を得るためにエンタープライズ ツールは必要ありません
Googleが従来のプロセッサを廃止するということは、本質的にGoogleがハードルが下がったことを認めたことに等しい。彼らが 2020 年と 2021 年に構築したツールは、もう十分ではありません。壊れたからではなく、現在可能になっていることがはるかに優れているため、古いバージョンを残しておくと価値よりも混乱が生じるからです。
日常の文書作業において、このテクノロジー サイクルの利点は、フィルタリングが行われることです。 WukongPDF はこのスペースにあります。これは、ほとんどの人が実際に必要とする PDF Workflow タスク (変換、圧縮、マージ、編集) を処理するブラウザー ベースのツールです。エンタープライズ インフラストラクチャや開発者がセットアップする必要はありません。基盤となるテクノロジーは進化し続けており、その結果、それを使用するツールも改良されています。
Google の発表からわかることは、プロセッサのバージョンを気にする必要はないということではありません。それは、ドキュメント テクノロジがここ数年で最も速い改善サイクルにあり、一般ユーザーが利用できるツールが現在、これまでよりも優れているということです。
PDF OCR を試してみる
インストールは必要ありません。ブラウザで直接動作します。
