Word에서 입력하고 PDF로 내보낸 10페이지 분량의 편지는 200KB일 수 있습니다. 동일한 10페이지를 스캔하여 PDF로 저장하면 30MB(150배)가 될 수 있습니다. 내용은 동일합니다. 파일 크기 차이가 엄청납니다. 사람들이 문서를 스캔한 다음 왜 결과를 이메일로 보낼 수 없는지 궁금해할 때 이런 문제가 끊임없이 발생합니다. PDF의 각 유형이 콘텐츠를 저장하는 방법을 이해하면 설명은 간단해집니다.

텍스트 데이터와 이미지 데이터: 기본적인 크기 차이
디지털 PDF는 텍스트를 문자 데이터로 저장합니다. 문자 "A" PDF에서 문자 "A"에 대한 참조로 저장됩니다. 특정 글꼴로 — 보는 사람에게 무엇을 그리고 어디에 그릴지 알려주는 몇 바이트의 정보입니다. 각 문자는 그림이 아닌 작은 참조일 뿐이므로 전체 텍스트 페이지는 5-10KB를 차지할 수 있습니다.
A 스캔됨 PDF은 각 페이지를 사진으로 저장합니다. 300 DPI 컬러로 촬영된 동일한 텍스트 페이지는 대략 2,500 × 3,500 픽셀의 격자로 구성됩니다. 이는 거의 900만 개의 개별 컬러 점으로, 각각의 정확한 색상을 설명하려면 데이터가 필요합니다. 압축 후에도 스캔한 텍스트의 단일 페이지는 일반적으로 1-5MB입니다. 10페이지는 10~50MB를 의미합니다.
압축 PDF 사용해 보기
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
크기 차이에 대한 수학
300 DPI로 스캔된 A4 페이지는 2,480 × 3,508 픽셀의 이미지를 생성합니다. 이는 약 870만 픽셀입니다. 풀 컬러(RGB)에서는 각 픽셀에 빨간색, 녹색, 파란색 값에 대해 각각 하나씩 3바이트의 데이터가 필요합니다. 압축되지 않은 경우 페이지당 약 26MB입니다.
JPEG 압축은 이를 극적으로 줄여줍니다. 일반적인 스캔 페이지는 1-3MB로 압축됩니다. 그러나 압축하더라도 실제 텍스트 문자와 동일한 콘텐츠를 저장하는 데 필요한 몇 KB보다 훨씬 더 큽니다. 내용은 동일합니다. 보관방법이 전혀 다릅니다.
컬러 vs 회색조 vs 흑백
스캔한 모든 PDF의 크기가 동일한 것은 아닙니다. 스캔 시 선택한 색상 모드는 다음과 같이 큰 영향을 미칩니다.
- 색상(RGB): 픽셀당 3바이트. 가장 큰 파일. 컬러 콘텐츠가 포함된 문서에 필요합니다. 흰 종이에 검은색 텍스트를 쓰기에는 낭비입니다.
- 회색조: 픽셀당 1바이트. 파일 크기는 컬러 스캔 크기의 약 1/3입니다. 입력된 문서, 양식 및 의미 있는 색상이 없는 모든 것에 이상적입니다.
- 흑백(1비트): 각 픽셀은 검정색 또는 흰색입니다. — 1비트 데이터입니다. 파일이 매우 작습니다. 회색 음영이 필요하지 않지만 그라데이션이나 사진이 있는 문서에는 가혹한 인쇄된 텍스트 문서에 가장 적합합니다.
편지, 계약서, 양식, 송장 등 대부분의 문서 스캔의 경우 150-200 DPI의 회색조는 읽기 쉽고 컴팩트하며 이메일 및 디지털 제출에 적합한 파일을 생성합니다.
대형 스캔 시 수행할 작업 PDFs
스캔이 이미 완료되었고 파일이 너무 큰 경우 압축이 가장 빠른 해결 방법입니다. PDF 압축은 스캔된 PDF을 크게(보통 60-80%까지) 줄여줍니다. 각 페이지의 이미지 데이터에는 압축으로 제거할 수 있는 상당한 중복성이 있기 때문입니다. www.wukongpdf.com의 WukongPDF이(가) 이를 처리합니다. 스캔한 PDF를 업로드하고, 중간 또는 높은 압축을 적용하고, 이메일로 보낼 수 있을 만큼 작은 파일을 다운로드합니다.
다시 스캔할 수 있으면 먼저 설정을 조정하십시오. 컬러에서 회색조로 전환하고 DPI를 300에서 150 또는 200으로 줄이고 스캐너 소프트웨어에 내장된 PDF 압축을 활성화하십시오. 소스에서의 이러한 변경은 공격적인 스캔 후 압축으로 인한 품질 저하 없이 훨씬 작은 파일을 생성합니다.
OCR 접근 방식: 더 작고 더 유용함
OCR을 통해 스캔한 PDF를 실행하면 검색이 가능해질 뿐만 아니라 파일 크기도 줄일 수 있습니다. 일부 OCR 도구는 텍스트를 추출한 후 고해상도 페이지 이미지를 저해상도 버전으로 대체합니다. 왜냐하면 텍스트 레이어는 가독성을 처리하고 이미지는 시각적 컨텍스트만 제공하면 되기 때문입니다. 결과적으로 검색 및 복사도 가능한 작은 파일이 생성됩니다. 이는 이미지 전용 스캔을 압축하는 것보다 더 나은 결과입니다.
압축 PDF 사용해 보기
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
