Others

Google 드라이브에서 PDF을 OCR할 수 있나요?

Google 드라이브에는 Google Docs로 스캔한 PDF을 열 때 자동으로 실행되는 내장 OCR이 포함되어 있습니다. 무료이고 추가 소프트웨어가 필요하지 않으며 대부분의 일반적인 문서에 충분히 잘 작동합니다. 알아야 할 제한 사항이 있지만 간단한 스캔 텍스트의 경우 작업을 안정적으로 처리합니다.

Can You OCR a PDF in Google Drive?

수행 방법

스캔한 PDF를 Google 드라이브에 업로드하세요. 업로드가 완료되면 파일을 마우스 오른쪽 버튼으로 클릭하고 다음으로 열기 → Google Docs를 선택하세요. Drive는 변환 중에 자동으로 OCR을 실행하고 결과를 편집 가능한 Google Docs 문서로 엽니다. 원본 PDF는 변경되지 않고 드라이브에 남아 있습니다. Google은 그와 함께 새 문서 파일을 만듭니다.

변환된 문서의 상단에는 인식된 텍스트가 포함되어 있고 그 아래에는 각 원본 페이지의 이미지가 포함되어 있습니다. 이 이중 레이어 접근 방식을 사용하면 Google이 인식한 내용과 원본 페이지의 실제 내용을 확인할 수 있습니다. 두 페이지를 나란히 비교하여 OCR 오류를 찾는 데 유용합니다.

WukongPDF

PDF OCR을 사용해 보세요.

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →

잘하는 일

일반 언어로 인쇄된 표준 텍스트를 깨끗하고 고대비로 스캔하려면 Google 드라이브의 OCR이 정확합니다. 200DPI 이상으로 스캔한 전문적으로 인쇄된 문서는 일반적으로 오류가 거의 없이 변환됩니다. 여러 언어를 처리하며 특별한 구성 없이도 혼합 언어 문서를 인식할 수 있는 경우가 많습니다.

출력은 Google Docs에서 즉시 편집할 수 있으므로 텍스트를 변경해야 하는 경우 편리합니다. Docs에서 다운스트림이 필요한 경우 PDF(파일 → 다운로드 → PDF 문서)로 다시 내보낼 수도 있고 Word 형식으로 내보낼 수도 있습니다.

부족한 점

Google 드라이브의 OCR은 원본 문서 레이아웃을 유지하지 않습니다. 테이블은 일반 텍스트로 제공되고 다중 열 형식은 선형화되며 복잡한 형식은 모두 손실됩니다. 인식된 텍스트는 일반 단락으로, 시각적으로는 소스 문서와 전혀 다릅니다.

레이아웃을 유지해야 하는 문서(재배포할 양식, 원래 디자인을 유지해야 하는 보고서)의 경우 Google 드라이브 OCR은 텍스트 콘텐츠를 제공하지만 서식을 수동으로 다시 적용해야 합니다. 데이터를 검색, 편집 또는 추출하기 위해 텍스트 콘텐츠만 필요한 문서의 경우 서식이 없어도 문제가 되지 않습니다.

낮은 품질의 스캔, 희미한 텍스트, 손글씨, 비정상적인 글꼴은 눈에 띄게 더 많은 오류를 생성합니다. CJK 문자(중국어, 일본어, 한국어)는 일반적으로 Google의 OCR 엔진에서 개선되었지만 복잡한 텍스트에 대한 라틴 스크립트 정확도에는 여전히 뒤떨어져 있습니다.

전용 OCR 도구가 더 나은 경우

PDF 형식(Google 문서가 아닌 검색 가능한 PDF)으로 유지되는 OCR 출력이 필요한 경우 Google 드라이브는 적합한 도구가 아닙니다. 텍스트 레이어가 있는 PDF로 다시 변환되지 않고 Docs 파일로 변환됩니다. 이를 위해 WukongPDF의 OCR PDF 도구는 스캔을 처리하고 원본 문서의 시각적 모양이 유지되는 동안 텍스트를 선택하고 검색할 수 있는 PDF를 반환합니다. 이것은 일반적으로 사람들이 "PDF를 OCR"하고 싶다고 말할 때 의미하는 것입니다. — 그들은 이미지가 아닌 인식 가능한 텍스트만 포함된 동일한 문서를 다시 원합니다.

많은 문서의 대량 OCR 또는 어려운 내용의 정확성이 중요한 문서의 경우 ABBYY FineReader와 같은 전용 OCR 소프트웨어는 유료 제품이라는 비용으로 Google 드라이브보다 더 나은 결과를 제공합니다. 깨끗하게 스캔한 문서의 일상적인 무료 OCR을 위해 Google 드라이브는 대부분의 사람들에게 다른 것이 필요하지 않을 정도로 잘 처리합니다.

WukongPDF

PDF OCR을 사용해 보세요.

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →