사람들은 종종 "PDF"를 사용합니다. 및 "스캔 문서" 특히 누군가가 "스캔해서 PDF 보내세요."라고 말하는 사무실 환경에서는 더욱 그렇습니다. 그러나 PDF와 스캔한 문서는 동일하지 않으며 둘을 혼동하면 큰 혼란을 야기합니다. 스캔은 PDF로 저장할 수 있지만 모든 PDF이 스캔인 것은 아니며 그 차이는 실질적인 결과를 가져옵니다.

PDF는 실제로 무엇인가요
PDF는 휴대용 문서 형식을 나타냅니다. 이는 실제 텍스트, 벡터 그래픽, 이미지, 하이퍼링크, 양식 필드, 책갈피 등 다양한 유형의 콘텐츠를 담을 수 있는 컨테이너인 파일 형식입니다. PDF 형식은 모든 장치나 운영 체제에서 일관되게 문서를 나타내도록 설계되었습니다.
Word 문서에서 생성된 PDF에는 실제 텍스트, 즉 컴퓨터가 읽고, 검색하고, 복사하고, 처리할 수 있는 문자가 포함되어 있습니다. Excel 스프레드시트에서 생성된 PDF에는 실제 데이터가 포함되어 있습니다. 브라우저에서 생성된 PDF에는 실제 웹페이지 콘텐츠가 포함되어 있습니다. 각각의 경우 PDF는 사진이 아닌 실제 내용이 포함된 구조화된 문서입니다.
PDF OCR을 사용해 보세요
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
스캔 문서란
스캔한 문서는 실제 페이지의 사진입니다. 스캐너는 종이에서 반사된 빛을 포착하여 이를 픽셀 격자, 즉 래스터 이미지로 변환합니다. 결과 파일은 문서 자체가 아니라 문서의 그림입니다. 스캔에 보이는 모든 텍스트는 글자처럼 보이도록 배열된 컬러 픽셀로만 존재합니다.
해당 스캔이 PDF로 저장되면 PDF 파일을 얻게 됩니다. 하지만 그 내용은 텍스트가 아닌 이미지입니다. PDF 컨테이너는 실제이지만, 그 안에 들어 있는 것은 사진입니다. 이를 이미지 전용 PDF 또는 스캔된 PDF이라고 하며 실제 텍스트 내용이 포함된 PDF와는 매우 다르게 동작합니다.
혼란이 존재하는 이유
혼란은 스캔한 문서가 일반적으로 PDFs로 저장된다는 사실에서 비롯됩니다. 스캐너 및 스캐너 앱은 일반적으로 기본적으로 .pdf 파일을 출력합니다. 따라서 누군가가 "PDF" 실제 텍스트가 포함된 디지털 PDF 또는 이미지 내용이 포함된 스캔 PDF을 받았을 수 있으며 두 파일은 화면에서 동일하게 보입니다.
파일을 사용하여 작업을 시도할 때만 차이점이 분명해집니다. 단어를 검색해 보세요. 문장을 복사해 보세요. 스크린 리더를 사용해 보세요. 디지털 PDF는 이 모든 것을 처리합니다. 스캔한 PDF는 텍스트 레이어를 추가하기 위해 OCR을 적용하지 않는 한 그 중 아무것도 처리하지 않습니다.
실질적인 차이점
- 검색 가능성: 디지털 PDF은 완전히 검색 가능합니다. OCR이 적용되지 않으면 스캔된 PDF는 결과를 반환하지 않습니다.
- 파일 크기: 디지털 PDF는 컴팩트합니다. 10페이지 텍스트 문서는 일반적으로 500KB 미만입니다. 스캔한 PDF는 페이지 이미지를 저장하며 일반적으로 10-100배 더 큽니다.
- 복사 및 붙여넣기: 디지털 PDF에서 텍스트를 선택하고 복사할 수 있습니다. 스캔한 PDF에서는 사용할 수 없습니다. 텍스트를 선택하려고 하면 전체 페이지 이미지가 선택됩니다.
- 편집: 디지털 PDF는 PDF 편집기를 사용하여 텍스트를 직접 편집할 수 있습니다. 스캔한 PDF에는 새 내용만 맨 위에 배치할 수 있으며 기존 이미지 내용은 변경할 수 없습니다.
- 접근성: 스크린 리더는 디지털 PDF와 함께 작동합니다. 스캔된 PDF는 OCR 텍스트 레이어 없이는 보조 기술에 완전히 접근할 수 없습니다.
어떤 유형인지 확인하는 방법
PDF를 열고 단어를 클릭해 보세요. 디지털 PDF에서는 커서가 텍스트 커서가 되며 개별 단어를 선택할 수 있습니다. 스캔한 PDF에서는 아무 일도 일어나지 않거나 전체 페이지가 하나의 블록으로 선택됩니다.
Ctrl+F를 누르고 페이지에 표시되는 단어를 검색하세요. 발견되면 PDF에 실제 텍스트가 있는 것입니다. 검색 결과가 아무것도 반환되지 않으면 이미지만 검색된 것입니다. 세 번째 지표는 확대/축소 품질입니다. 디지털 PDF를 확대하면 어떤 배율에서도 텍스트가 선명하게 유지되는 반면, 스캔한 PDF를 확대하면 이미지를 확대할 때 픽셀화가 나타납니다.
스캔한 PDF를 디지털 문서처럼 작동하도록 만들기
OCR — 광학 문자 인식 — 스캔한 PDF의 이미지를 읽고, 텍스트 문자를 인식하고, 파일에 실제 텍스트 레이어를 추가합니다. OCR 후에는 문서를 검색, 복사 및 액세스할 수 있습니다. www.wukongpdf.com에 있는 WukongPDF의 OCR 도구는 데스크톱 소프트웨어 없이 이 작업을 수행합니다. 스캔한 PDF를 업로드하고 OCR을 실행하고 실제 텍스트가 포함된 버전을 다운로드하세요. 스캔된 PDF을 기본 디지털 문서로 변환하지는 않지만 대부분의 실질적인 격차를 해소합니다.
PDF OCR을 사용해 보세요
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
