예 — 하지만 디지털로 생성된 PDF를 변환하는 것과 비교하면 추가 단계가 필요합니다. 스캔한 PDF는 구조화된 데이터가 포함된 문서가 아닌 이미지이므로 변환 프로세스에서는 먼저 이미지의 텍스트와 숫자를 인식해야 스프레드시트 셀에 배치할 수 있습니다. 이것이 잘 작동하면 시간이 크게 절약됩니다. 그렇지 않은 경우 정리가 필요합니다.

스캔된 PDF이 다른 이유
디지털 방식으로 생성된 PDF는 데이터를 실제 문자, 즉 직접 읽고 셀에 배치할 수 있는 숫자로 저장합니다. 스캔한 PDF는 페이지를 사진으로 저장합니다. "숫자" 스캔한 테이블에는 숫자처럼 보이는 픽셀이 있습니다. 이를 Excel로 추출하려면 소프트웨어는 해당 픽셀을 보고 어떤 문자를 나타내는지 결정한 다음 테이블의 구조를 파악해야 합니다. 즉, 어떤 픽셀이 행을 형성하고, 열을 형성하고, 셀 경계가 어디에 있는지를 파악해야 합니다.
테이블 구조 감지와 광학 문자 인식이 결합된 이 프로세스는 단순한 PDF에서 Excel로의 변환보다 더 복잡하고 오류 가능성이 더 높습니다.
PDF를 Excel로 사용해 보세요
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
전환 품질에 영향을 미치는 요소
스캔 품질이 가장 큰 요소입니다. 200+ DPI로 선명하게 인쇄된 표를 깨끗하고 고대비로 스캔하면 변환이 잘 됩니다. OCR은 문자를 정확하게 읽고 표 구조를 인식할 수 있습니다. 저해상도 스캔, 흐린 문서, 기울어진 페이지 또는 셀에 손으로 쓴 숫자는 훨씬 더 나쁜 결과를 낳습니다.
테이블 구조의 복잡성도 중요합니다. 명확한 테두리와 일관된 행 높이가 있는 간단한 그리드는 병합된 셀, 확장 헤더, 중첩된 하위 테이블 또는 다양한 높이의 행이 있는 복잡한 테이블보다 더 안정적으로 변환됩니다. 구조가 단순할수록 변환 소프트웨어가 내려야 하는 결정이 줄어들고 이러한 결정이 잘못될 가능성이 줄어듭니다.
수행 방법
WukongPDF의 PDF to Excel 도구는 스캔한 PDF을 직접 처리합니다. OCR 단계는 변환의 일부로 자동으로 실행됩니다. 스캔한 PDF를 업로드하고 출력 형식으로 Excel을 선택한 후 다운로드하세요. 잘 구조화된 테이블을 깔끔하게 스캔하려면 최소한의 정리만으로 출력을 사용할 수 있는 경우가 많습니다. Excel 파일을 열고, 데이터를 검토하고, OCR 오류(잘못 읽은 문자, 병합 또는 분할 셀)를 수정하면 스프레드시트를 사용할 수 있습니다.
Adobe Acrobat Pro는 스캔한 PDF를 Excel로 변환하는 기능이 특히 강력하며 대부분의 무료 도구보다 테이블 감지 기능이 뛰어납니다. 액세스 권한이 있고 문서가 복잡한 경우 다른 곳에서 정리하더라도 초기 변환에 사용할 가치가 있습니다.
변환 후 확인 사항
특히 수치 데이터의 경우 검토 없이 스캔한 PDF 변환을 신뢰하지 마십시오. OCR은 일반적으로 특정 문자 쌍(0과 O, 1과 l, 5와 S, 8과 B)을 혼동합니다. 일부 0이 문자 O로 읽혀지는 재무 테이블에는 공식이 깨져 합계가 올바르지 않게 됩니다. 중요한 데이터를 사용하기 전에 원본 스캔과 비교하여 주요 수치를 즉각 확인하십시오.
열 정렬 확인: 원래 테이블의 간격이 불규칙하거나 셀이 병합된 경우 변환을 통해 데이터가 잘못된 열에 배치되는 경우가 있습니다. 개별 값을 간단히 확인하는 것이 아니라 Excel 출력의 구조를 원본 스캔과 페이지별로 비교하세요.
수동 입력이 더 빠른 경우
매우 짧은 테이블(20행 미만) 또는 변환이 잘 안되는 복잡한 구조의 테이블의 경우 수동 데이터 입력이 변환 및 정리보다 빠른 경우가 있습니다. 5개 열이 있는 10행 테이블을 입력하는 데 약 3분이 걸립니다. 변환 결과 상당한 수정이 필요한 결과가 나오면 직접 입력할 때보다 더 많은 시간을 소비한 것입니다.
변환 접근 방식은 긴 테이블, 즉 수동 입력에 몇 시간이 걸리는 수십 또는 수백 개의 행에 대해 가장 확실한 효과를 발휘합니다. 이러한 경우 정리를 통한 불완전한 변환이라도 처음부터 시작하는 것보다 거의 항상 빠릅니다.
PDF를 Excel로 사용해 보세요
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
