Google Document AI가 6월 30일에 레거시 프로세서를 중단합니다. 그 신호는 다음과 같습니다.

2026년 2월 17일, Google은 Document AI 출시 노트에 지원 중단 알림을 조용히 게시했습니다. 메시지는 기술적이고 간략했습니다. 일부 레거시 프로세서(일부는 2020년과 2021년으로 거슬러 올라감)가 2026년 6월 30일에 작동을 중단할 것입니다. 이를 사용하는 개발자는 해당 날짜 이전에 마이그레이션해야 하며 그렇지 않으면 서비스 오류가 발생합니다.

PDFs를 매일 사용하는 대부분의 사람들에게 이 알림은 아무 의미가 없습니다. 그러나 이는 실제로 PDF OCR 및 문서 처리 기술의 발전 속도와 이러한 변화가 문서 작업을 하는 모든 사람에게 어떤 의미인지를 보여주는 유용한 창입니다.

Google Document AI Is Retiring Legacy Processors on June 30 — Here's What It Signals

실제로 꺼지는 기능

Google Document AI는 문서의 정보를 자동으로 읽고, 해석하고, 추출하는 클라우드 서비스입니다. 기업에서는 이를 사용하여 세금 양식, 은행 명세서, 송장, 모기지 문서 등을 대규모로 처리하고 PDF를 입력하고 구조화된 데이터를 가져옵니다.

폐기되는 프로세서에는 여권 및 운전 면허증용 신원 파서, W-9 및 1099용 세금 양식 파서, 모기지 명세서 도구, 공과금 청구서 파서 및 문서 분할 모델 등 광범위한 전문 도구가 포함됩니다. 이들 중 가장 오래된 것은 2020년에 지어졌습니다. 몇몇은 2021년이나 2022년에 마지막으로 업데이트되었습니다.

Google에서 권장하는 대체 제품은 모두 Enterprise Document OCR v2.1, 업데이트된 송장 및 비용 파서, Gemini에서 제공하는 맞춤 추출기 등 최신 모델에서 실행됩니다. 기존 프로세서가 수행할 수 있는 작업과 새 프로세서가 수행할 수 있는 작업 사이의 격차는 상당하며, 이러한 격차가 바로 Google이 전환을 강요하는 이유입니다.

PDF OCR을 사용해 보세요.

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →

Gemini가 문서 처리 수학을 변경한 이유

원래 Document AI 프로세서는 대부분의 OCR이 항상 작동했던 방식으로 작동했습니다. 즉, 특정 문서 레이아웃을 인식하도록 훈련되었습니다. W-9 양식을 입력하고 해당 양식에서 특정 필드를 가져옵니다. 예측 가능한 형식의 구조화된 문서에는 충분히 정확했지만 취약했습니다. 레이아웃을 조금만 변경하면 정확도가 떨어졌습니다.

교체 프로세서는 Gemini를 기반으로 사용합니다. 고정된 템플릿에 얽매이는 대신 컨텍스트를 읽고, 변형을 처리하고, 페이지의 위치가 아닌 필드의 의미를 식별하는 등 사람과 마찬가지로 문서를 더 잘 이해합니다. 2026년 1월에 출시되고 Gemini 3 Flash를 기반으로 구축된 Google의 Layout Parser v1.6은 이제 파싱된 문서 내의 이미지와 테이블을 식별하고 설명할 수 있습니다. 이는 기존 도구로는 불가능했던 일입니다.

Google의 관점에서 볼 때 기존 프로세서를 새 프로세서와 함께 계속 실행하는 것은 기술적 부채일 뿐입니다. 새 모델은 동일한 작업을 더 잘 수행하므로 두 개의 병렬 시스템을 무한정 유지하는 것은 의미가 없습니다.

Document AI가 어디로 가는지에 대해 보내는 신호

이러한 프로세서의 폐기는 단순한 관리 작업이 아닙니다. 이는 더욱 의미 있는 일입니다. 1세대 AI 기반 문서 도구는 출시된 지 5년이 채 지나지 않아 이미 구식이 되었습니다.

그것은 빠른 주기입니다. 그리고 그것은 상황이 어디로 향하고 있는지를 가리킵니다. 2026년의 Document AI는 더 이상 페이지의 텍스트를 읽는 것이 아닙니다. 최신 시스템은 문서 구조, 상호 참조 필드를 이해하고 복잡한 레이아웃이 있는 다중 페이지 문서를 처리하며 처음부터 다시 구축하지 않고도 특정 산업에 맞게 미세 조정할 수 있습니다. Gemini에서 실행되는 사용자 정의 추출기는 새로운 문서 유형을 지정하고 최소한의 설정으로 유용한 데이터 추출을 시작할 수 있습니다. 이는 불과 몇 년 전만 해도 레이블이 지정된 교육 데이터에 수개월이 걸렸을 것입니다.

이러한 플랫폼을 기반으로 구축하는 모든 사람에게 실질적인 의미는 오늘날 최첨단 제품이 예전보다 유통 기한이 짧다는 것입니다. 교체 속도가 빨라지고 있습니다.

PDFs만 사용하면 이것이 의미하는 바

개발자가 아니고 Google Cloud 인프라를 운영하는 회사에서 근무하지 않는 경우에는 6월 30일 기한이 직접적으로 영향을 미치지 않습니다. 그러나 근본적인 변화는 보다 실용적인 방식으로 중요합니다.

기업의 문서 처리 성능을 획기적으로 향상시키는 동일한 기술이 일상적인 PDF 도구에도 나타나기 시작했습니다. 스캔한 PDF 내부를 검색하거나 양식에서 자동으로 데이터를 가져오거나 사진이 찍힌 영수증을 편집 가능한 텍스트로 변환하는 기능은 값비싼 소프트웨어나 클라우드 서비스가 필요했습니다. 이를 지원하는 모델은 몇 달마다 점점 더 저렴해지고 빨라지고 있습니다.

이것이 실제로 의미하는 바: 일상적인 사용 사례에 과도하다고 느껴지는 도구가 대부분의 사람들이 실제로 필요한 수준에서 액세스할 수 있게 되었습니다. 스캔한 PDF 변환에서 텍스트를 추출하려고 시도했는데 문자가 깨져 엉망이 된 적이 있다면 그 경험과 현재 가능한 것 사이의 격차가 상당합니다.

엔터프라이즈 수준의 결과를 얻기 위해 엔터프라이즈 도구가 필요하지 않습니다

Google이 레거시 프로세서를 폐기하는 것은 본질적으로 기준이 이동했음을 Google이 인정하는 것입니다. 2020년과 2021년에 구축한 도구는 더 이상 충분하지 않습니다. 고장났기 때문이 아니라, 지금 가능한 것이 훨씬 더 좋아져서 이전 버전을 그대로 유지하면 가치보다는 혼란이 더 커지기 때문입니다.

일상적인 문서 작업에서 이 기술 주기의 이점은 필터링이 가능하다는 것입니다. WukongPDF은(는) 엔터프라이즈 인프라나 개발자가 이를 설정할 필요 없이 변환, 압축, 병합, 편집 등 대부분의 사람들에게 실제로 필요한 PDF 워크플로 작업을 처리하는 브라우저 기반 도구인 이 공간에 있습니다. 기본 기술은 계속해서 향상되고, 이를 사용하는 도구도 결과적으로 더욱 좋아집니다.

Google의 발표에서 얻을 수 있는 점은 프로세서 버전에 대해 걱정할 필요가 없다는 것입니다. 문서 기술은 수년 만에 가장 빠른 개선 주기 중 하나에 속해 있으며 일반 사용자가 사용할 수 있는 도구는 그 어느 때보다 지금 더 좋습니다.

PDF OCR을 사용해 보세요.

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →