Others

스캔된 PDF 대 디지털 PDF: 주요 차이점

두 개의 PDF는 화면에서 동일하게 보이지만 완전히 다르게 동작할 수 있습니다. 하나가 열리면 텍스트를 클릭하고, 단어를 검색하고, 단락을 복사할 수 있습니다. 다른 하나는 동일해 보이지만 클릭해도 아무 작업도 수행되지 않습니다. 커서가 텍스트 위에 놓이지 않으며 Ctrl+F는 아무것도 찾지 않습니다. 차이점은 PDF가 디지털 방식으로 생성되었는지 아니면 실제 문서를 스캔하여 생성되었는지입니다. 이러한 차이점을 이해하면 사람들이 PDF에서 직면하게 되는 많은 실망스러운 행동을 설명할 수 있습니다.

Scanned PDF vs Digital PDF: Key Differences

각 유형이 생성되는 방법

디지털 PDF는 소프트웨어에서 직접 생성됩니다. 즉, Word에서 내보내거나, 회계 소프트웨어로 생성하거나, 웹 브라우저의 인쇄 기능으로 생성하거나, PDF를 출력할 수 있는 모든 응용 프로그램에서 생성됩니다. 파일의 텍스트는 실제 문자 데이터입니다. 컴퓨터는 모든 단어, 모든 문자, 모든 공백을 알고 있습니다.

스캔한 PDF는 실제 문서를 촬영하거나 스캔하여 생성됩니다. 스캐너는 페이지 이미지(텍스트처럼 보이지만 텍스트 데이터가 포함되지 않은 픽셀 격자)를 캡처합니다. 파일은 PDF 컨테이너에 싸인 사진입니다. 컴퓨터는 단어가 아닌 이미지를 봅니다.

WukongPDF

PDF OCR을 사용해 보세요

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →

어떤 유형인지 확인하는 방법

가장 빠른 테스트: 클릭하고 드래그하여 단어를 선택해 보세요. 디지털 PDF에서는 커서가 텍스트 커서로 바뀌고 개별 단어가 강조 표시됩니다. 스캔한 PDF에서는 아무 것도 강조 표시되지 않거나 전체 페이지가 하나의 이미지 블록으로 선택됩니다.

두 번째 테스트: Ctrl+F를 누르고 페이지에서 볼 수 있는 단어를 검색하세요. 디지털 PDF에서는 즉시 찾을 수 있습니다. 스캔한 PDF에서 검색하면 아무것도 반환되지 않습니다. 세 번째 지표는 파일 크기입니다. 스캔된 PDF는 효율적인 텍스트 인코딩 대신 이미지 데이터를 저장하기 때문에 일반적으로 동일한 내용의 디지털 PDF보다 훨씬 큽니다.

실제 주요 차이점

  • 검색 가능성: 디지털 PDF는 콘텐츠별로 완전히 검색 가능합니다. 스캔된 PDF는 검색에 표시되지 않습니다. OCR이 적용되지 않는 한 파일 이름으로만 찾을 수 있습니다.
  • 복사 및 붙여넣기: 디지털 PDF를 사용하면 텍스트 선택 및 복사가 가능합니다. 스캔한 PDF는 그렇지 않습니다. 추출하려는 콘텐츠를 다시 입력해야 합니다.
  • 파일 크기: 10페이지 디지털 텍스트 문서는 일반적으로 100~300KB입니다. 300 DPI의 컬러 스캔과 동일한 페이지는 20-40MB로 대략 100배 더 큽니다.
  • 접근성: 스크린 리더는 디지털 PDF와 함께 작동합니다. 스캔된 PDF는 OCR 없이는 전혀 액세스할 수 없습니다. 화면 판독기가 읽을 텍스트가 없습니다.
  • 인쇄 품질: 디지털 PDFs는 텍스트와 벡터 요소의 크기가 무한대로 확장되므로 품질 손실 없이 어떤 크기로든 인쇄됩니다. 스캔한 PDF는 고정 해상도로 인쇄됩니다. 충분히 확대하면 픽셀이 보입니다.
  • 편집: 디지털 PDF는 PDF 편집기를 사용하여 편집할 수 있습니다. 텍스트를 클릭하고 직접 변경할 수 있습니다. 스캔한 PDF는 기존 콘텐츠를 변경하는 것이 아니라 이미지 위에 새 콘텐츠를 배치해야만 편집할 수 있습니다.

간극 해소: OCR의 기능

OCR(광학 문자 인식)은 스캔한 PDF와 디지털 PDF 사이의 격차를 대부분 줄여줍니다. OCR 도구를 통해 스캔된 PDF을 실행하면 파일에 실제 텍스트 레이어가 추가됩니다. 이미지는 계속 표시되지만 그 아래에는 소프트웨어가 실제 문자를 인식하고 삽입했습니다. OCR 후에는 문서를 검색하고 복사할 수 있으며 화면 판독기에서 액세스할 수 있습니다.

OCR은 완벽하지 않습니다. 정확도는 스캔 품질, 글꼴 선명도 및 언어에 따라 달라집니다. 그러나 표준 글꼴로 입력된 문서를 깔끔하게 스캔하는 경우 최신 OCR은 매우 정확하며 실망스러운 이미지 전용 PDF을 적절한 디지털 문서처럼 작동하는 문서로 변환합니다. www.wukongpdf.com에 있는 WukongPDF의 OCR 도구는 데스크톱 소프트웨어 없이도 이를 처리합니다.

다른 목적으로 사용할 유형

  • 직접 만든 문서의 경우: 항상 소스 응용 프로그램에서 내보내 디지털 PDF를 만듭니다. 디지털 방식으로 만든 인쇄물을 스캔하지 마십시오. 불필요한 품질 저하가 발생합니다.
  • 디지털이어야 하는 실제 문서의 경우: 스캔이 유일한 옵션이지만 결과를 디지털 PDF만큼 유용하게 만들려면 즉시 OCR을 실행하세요.
  • 중요한 문서 보관용: 원본 디지털 소스가 있는 경우 디지털 PDF을 보관하세요. 실제 문서만 있는 경우 스캔하고 OCR을 적용한 후 압축하고 OCR 처리된 버전을 저장하세요.
WukongPDF

PDF OCR을 사용해 보세요

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →