News & Insights

Google Document AI retirará los procesadores heredados el 30 de junio: esto es lo que indica

El 17 de febrero de 2026, Google publicó silenciosamente un aviso de obsolescencia en sus notas de la versión de Document AI. El mensaje era técnico y breve: un lote de procesadores heredados, algunos de 2020 y 2021, dejarían de funcionar el 30 de junio de 2026. Los desarrolladores que los usaran debían migrar antes de esa fecha o enfrentarían una falla en el servicio.

Para la mayoría de las personas que simplemente usan PDFs día a día, este aviso no significa nada. Pero en realidad es una ventana útil a la velocidad con la que avanza la tecnología detrás de PDF OCR y el procesamiento de documentos, y lo que ese cambio significa para cualquiera que trabaje con documentos.

Google Document AI Is Retiring Legacy Processors on June 30 — Here's What It Signals

Qué se está desactivando realmente

Google Document AI es un servicio en la nube que lee, interpreta y extrae información de documentos automáticamente. Las empresas lo utilizan para procesar cosas como formularios de impuestos, extractos bancarios, facturas y documentos hipotecarios a escala: ingresando PDFs y obteniendo datos estructurados.

Los procesadores que se están retirando incluyen una amplia gama de herramientas especializadas: analizadores de identidad para pasaportes y licencias de conducir, analizadores de formularios de impuestos para W-9 y 1099, herramientas de extractos de hipotecas, analizadores de facturas de servicios públicos y modelos de división de documentos. Los más antiguos se construyeron en 2020. Varios se actualizaron por última vez en 2021 o 2022.

Todos los reemplazos recomendados por Google se ejecutan en modelos más nuevos: Enterprise Document OCR v2.1, analizadores de facturas y gastos actualizados y extractores personalizados con tecnología Gemini. La brecha entre lo que podían hacer los procesadores antiguos y lo que podían hacer los nuevos es significativa, y esa brecha es exactamente la razón por la que Google está forzando el cambio.

WukongPDF

Pruebe PDF OCR

No se necesita instalación. Funciona directamente en su navegador.

Empezar ahora →

Por qué Gemini cambió las matemáticas en el procesamiento de documentos

Los procesadores de Document AI originales funcionaron de la misma manera que siempre lo ha hecho la mayoría de los OCR: fueron capacitados para reconocer diseños de documentos específicos. Introduzca un formulario W-9 y recupere los campos específicos de ese formulario. Era lo suficientemente preciso para documentos estructurados con formatos predecibles, pero frágil: cambiaba el diseño aunque fuera ligeramente y la precisión disminuía.

Los procesadores de reemplazo utilizan Gemini como base. En lugar de estar atados a una plantilla fija, entienden los documentos más como lo haría una persona: leen el contexto, manejan la variación, identifican lo que significa un campo en lugar de simplemente dónde se encuentra en la página. Layout Parser v1.6 de Google, lanzado en enero de 2026 y basado en Gemini 3 Flash, ahora puede identificar y describir imágenes y tablas dentro de documentos analizados, algo que las herramientas heredadas simplemente no podían hacer.

Desde la perspectiva de Google, mantener los procesadores antiguos funcionando junto con los nuevos es sólo una deuda técnica. Los nuevos modelos hacen mejor el mismo trabajo y mantener dos sistemas paralelos indefinidamente no tiene sentido.

La señal que esto envía sobre hacia dónde se dirige la IA del documento

La retirada de estos procesadores no es sólo una tarea de limpieza. Marca algo más significativo: la primera generación de herramientas de documentos impulsadas por IA ya está obsoleta, menos de cinco años después de su lanzamiento.

Ese es un ciclo rápido. Y señala hacia dónde se dirigen las cosas. Document AI en 2026 ya no se trata de leer texto de una página. Los sistemas más nuevos comprenden la estructura de los documentos, los campos de referencias cruzadas, manejan documentos de varias páginas con diseños complejos y pueden ajustarse para industrias específicas sin tener que reconstruirlos desde cero. Un extractor personalizado que se ejecuta en Gemini puede apuntar a un nuevo tipo de documento y comenzar a extraer datos útiles con una configuración mínima, algo que habría requerido meses de datos de entrenamiento etiquetados hace apenas unos años.

La implicación práctica para cualquiera que construya sobre estas plataformas: lo que hoy es de vanguardia tiene una vida útil más corta que antes. El ritmo de sustitución se está acelerando.

Qué significa esto si solo trabaja con PDFs

Si no es desarrollador y no trabaja en una empresa que ejecuta la infraestructura de Google Cloud, la fecha límite del 30 de junio no le afecta directamente. Pero el cambio subyacente importa desde un punto de vista más práctico.

La misma tecnología que está mejorando drásticamente el procesamiento de documentos empresariales está empezando a aparecer también en las PDF herramientas cotidianas. La capacidad de buscar dentro de un PDF escaneado, extraer datos de un formulario automáticamente o convertir un recibo fotografiado en texto editable, antes requería software costoso o servicios en la nube. Los modelos que los impulsan son cada pocos meses más baratos y más rápidos.

Lo que esto significa en la práctica: herramientas que parecían excesivas para casos de uso cotidianos se están volviendo accesibles al nivel que la mayoría de la gente realmente necesita. Si alguna vez intentó extraer texto de una conversión PDF escaneada y obtuvo un montón de caracteres confusos, la brecha entre esa experiencia y lo que ahora es posible es significativa.

No necesita herramientas empresariales para obtener resultados de calidad empresarial

Que Google retire sus procesadores heredados es esencialmente que Google admita que el listón se ha movido. Las herramientas que crearon en 2020 y 2021 ya no son lo suficientemente buenas, no porque se rompieron, sino porque lo que ahora es posible es mucho mejor que mantener la versión anterior crea más confusión que valor.

Para el trabajo diario con documentos, la ventaja de este ciclo tecnológico es que se filtra. WukongPDF se encuentra en este espacio: una herramienta basada en navegador que maneja las PDF flujo de trabajo tareas que la mayoría de las personas realmente necesitan: convertir, comprimir, fusionar, editar, sin necesidad de infraestructura empresarial o un desarrollador para configurarlo. La tecnología subyacente sigue mejorando y, como resultado, las herramientas que la utilizan mejoran.

La conclusión del anuncio de Google no es que deba preocuparse por las versiones del procesador. Es que la tecnología documental se encuentra en uno de sus ciclos de mejora más rápidos en años, y las herramientas disponibles para los usuarios habituales son mejores ahora que nunca.

WukongPDF

Pruebe PDF OCR

No se necesita instalación. Funciona directamente en su navegador.

Empezar ahora →