17 февраля 2026 года Google незаметно опубликовал уведомление об устаревании в примечаниях к выпуску Document AI. Сообщение было техническим и кратким: партия устаревших процессоров, некоторые из которых были выпущены в 2020 и 2021 годах, перестанут работать 30 июня 2026 года. Разработчикам, использующим их, необходимо было мигрировать до этой даты, иначе им грозит сбой в обслуживании.
Для большинства людей, которые просто используют PDF изо дня в день, это уведомление ничего не значит. Но на самом деле это полезная информация о том, как быстро развивается технология, лежащая в основе PDF OCR и обработки документов, и что этот сдвиг означает для всех, кто работает с документами.

Что на самом деле отключают
Google Document AI — это облачный сервис, который автоматически считывает, интерпретирует и извлекает информацию из документов. Предприятия используют его для масштабной обработки таких вещей, как налоговые формы, банковские выписки, счета-фактуры и ипотечные документы — загрузка PDF-файлов и получение структурированных данных.
Выходящие из эксплуатации процессоры включают в себя широкий спектр специализированных инструментов: анализаторы идентификационных данных паспортов и водительских прав, анализаторы налоговых форм W-9 и 1099, инструменты выписки по ипотечным кредитам, анализаторы счетов за коммунальные услуги и модели разделения документов. Самые старые из них были построены в 2020 году. Некоторые последний раз обновлялись в 2021 или 2022 году.
Все рекомендованные Google замены работают на более новых моделях — Enterprise Document OCR v2.1, обновленных анализаторах счетов и расходов, а также настраиваемых экстракторах на базе Gemini. Разрыв между тем, что могли делать старые процессоры, и тем, что могут делать новые, значителен, и именно этот разрыв является причиной того, что Google форсирует переход.
Попробуйте PDF OCR
Никакой установки не требуется. Работает прямо в вашем браузере.
Почему компания Gemini изменила математический подход к обработке документов
Оригинальные процессоры Document AI работали так же, как всегда работало большинство OCR: они были обучены распознавать определенные макеты документов. Введите форму W-9 и получите обратно определенные поля из этой формы. Он был достаточно точен для структурированных документов предсказуемых форматов, но ненадежен — стоит лишь слегка изменить макет, и точность упадет.
В основе новых процессоров лежит Gemini. Вместо того, чтобы быть привязанными к фиксированному шаблону, они понимают документы больше, чем человек — считывая контекст, обрабатывая варианты, определяя, что означает поле, а не просто то, где оно находится на странице. Google Layout Parser v1.6, выпущенный в январе 2026 года и построенный на Gemini 3 Flash, теперь может идентифицировать и описывать изображения и таблицы внутри анализируемых документов, чего устаревшие инструменты просто не могли сделать.
С точки зрения Google, сохранение работы старых процессоров рядом с новыми — это всего лишь технический долг. Новые модели лучше справляются с той же задачей, и поддерживать две параллельные системы бесконечно не имеет смысла.
Сигнал, который он посылает о том, куда движется документ AI
Вывод этих процессоров из эксплуатации — это не просто хозяйственная задача. Это знаменует собой нечто более значимое: первое поколение инструментов для работы с документами на основе искусственного интеллекта уже устарело, менее чем через пять лет после их запуска.
Это быстрый цикл. И это указывает на то, куда все движется. Искусственный интеллект документов в 2026 году больше не будет сводится к чтению текста со страницы. Новые системы понимают структуру документа, поля перекрестных ссылок, обрабатывают многостраничные документы со сложным макетом и могут быть точно настроены для конкретных отраслей без необходимости перестройки с нуля. Пользовательский экстрактор, работающий на Gemini, можно указать на новый тип документа и начать извлекать полезные данные с минимальной настройкой — всего несколько лет назад на это потребовались бы месяцы помеченных обучающих данных.
Практический вывод для всех, кто строит на этих платформах: то, что сегодня является передовым, имеет более короткий срок годности, чем раньше. Темпы замены ускоряются.
Что это значит, если вы просто работаете с PDFs
Если вы не разработчик и не работаете в компании, использующей инфраструктуру Google Cloud, крайний срок 30 июня не касается вас напрямую. Но основной сдвиг имеет более практическое значение.
Та же технология, которая значительно улучшает обработку корпоративных документов, начинает появляться и в повседневных PDF Tools. Возможность выполнять поиск внутри отсканированного PDF, автоматически извлекать данные из формы или преобразовывать сфотографированную квитанцию в редактируемый текст — раньше для этого требовалось дорогое программное обеспечение или облачные сервисы. Модели, на которых они работают, каждые несколько месяцев становятся дешевле и быстрее.
Что это означает на практике: инструменты, которые казались излишними для повседневного использования, становятся доступными на том уровне, который действительно нужен большинству людей. Если вы когда-либо пытались извлечь текст из отсканированного PDF Conversion и получали кучу искаженных символов, разрыв между этим опытом и тем, что возможно сейчас, значителен.
Для получения результатов корпоративного качества не нужны корпоративные инструменты
Отказ Google от своих устаревших процессоров, по сути, означает, что Google признает, что планка сдвинулась. Инструменты, которые они создали в 2020 и 2021 годах, уже недостаточно хороши — не потому, что они сломались, а потому, что то, что возможно сейчас, настолько лучше, что сохранение старой версии создает больше путаницы, чем пользы.
Для повседневной работы с документами преимуществом этого технологического цикла является то, что он фильтрует информацию. В этом пространстве находится WukongPDF — инструмент на основе браузера, который выполняет задачи PDF Workflow, которые действительно нужны большинству людей: преобразование, сжатие, объединение, редактирование — без необходимости использования корпоративной инфраструктуры или разработчика для его настройки. Базовая технология постоянно совершенствуется, и в результате улучшаются инструменты, использующие ее.
Вывод из заявления Google не в том, что вам нужно беспокоиться о версиях процессоров. Дело в том, что технология документирования переживает один из самых быстрых циклов совершенствования за последние годы, а инструменты, доступные обычным пользователям, сейчас лучше, чем когда-либо.
Попробуйте PDF OCR
Никакой установки не требуется. Работает прямо в вашем браузере.
