Ctrl+F가 아무것도 찾지 못하고, 텍스트를 선택하거나 복사할 수 없으며, 텍스트를 클릭하면 개별 단어가 강조 표시되지 않고 직사각형 상자가 그려지는 PDF — 이는 텍스트 레이어가 없는 문서입니다. 텍스트가 아닌 이미지로 저장됩니다. 즉, 독자는 문자를 볼 수 있지만 소프트웨어는 이를 문자로 해석할 수 없습니다.

일부 PDF에 텍스트 레이어가 없는 이유
가장 일반적인 이유는 스캔입니다. 실제 문서를 스캔하여 PDF로 저장하면 PDF 컨테이너에 포장된 페이지 사진이 생성됩니다. 스캐너는 문서의 모습을 이미지로 캡처하지만 문자가 무엇인지는 알 수 없습니다. 이미지를 해석하고 텍스트 데이터를 추가하는 별도의 OCR 단계가 없으면 PDF는 전적으로 이미지 기반입니다.
기타 원인: 텍스트를 텍스트로 유지하지 않고 모든 콘텐츠를 그래픽으로 처리하는 특정 디자인 소프트웨어에서 내보낸 PDF, 텍스트를 윤곽선으로 변환한 PDF(시각적 모양은 수정하지만 텍스트 레이어를 파괴하는 디자인 기술), OCR을 적용하는 스캐닝 앱 없이 휴대폰으로 문서를 촬영하여 생성된 PDF.
PDF OCR을 사용해 보세요.
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
문제 확인
가장 빠른 테스트: 단어를 클릭하고 끌어서 단어를 선택해 보세요. 개별 단어나 문자가 강조 표시되면 PDF에 텍스트 레이어가 있고 검색이 가능한 것입니다. 이 경우 다른 요인으로 인해 검색이 실패하는 것입니다(깨진 텍스트 레이어에 대한 아래 섹션 참조). 드래그한 위치와 관계없이 전체 페이지 영역이 직사각형으로 선택되면 해당 페이지는 텍스트가 없는 이미지로 저장됩니다.
보조 확인: Ctrl+A를 눌러 모두 선택합니다. 텍스트 레이어가 있는 문서에서는 모든 텍스트가 선택되어 복사할 수 있습니다. 이미지 전용 PDF에서 Ctrl+A는 페이지를 전체 개체로 선택합니다. 복사할 때 클립보드에 텍스트가 배치되지 않습니다.
OCR을 사용하여 텍스트 레이어 추가
OCR(광학 문자 인식)은 각 페이지의 이미지를 읽고 인식된 문자가 포함된 숨겨진 텍스트 레이어를 추가합니다. 문서의 시각적 모양은 변경되지 않고 여전히 원본 스캔과 동일하게 보이지만 텍스트는 선택, 복사 및 검색이 가능해집니다.
WukongPDF의 OCR PDF 도구는 브라우저에서 이 작업을 처리합니다. 즉, 스캔한 PDF를 업로드하고 OCR을 실행하고 검색 가능한 버전을 다운로드합니다. 표준 인쇄 텍스트를 깨끗하고 고대비로 스캔하는 경우 결과 텍스트 레이어를 검색할 수 있을 만큼 정확도가 높습니다. 처리된 파일을 열고 Ctrl+F를 눌러 확인하세요. 문서에 명확하게 나타나는 단어를 검색하면 즉시 찾을 수 있습니다.
텍스트 레이어가 있지만 검색이 여전히 작동하지 않는 경우
때로는 PDF에 선택할 수 있는 텍스트가 있지만 Ctrl+F를 눌러도 찾을 수 없는 경우가 있습니다. 이는 일반적으로 세 가지 중 하나로 귀결됩니다. 첫째, 글꼴 인코딩이 손상되었을 수 있습니다. PDF에 텍스트 데이터가 있지만 문자 매핑 테이블이 손상되어 뷰어가 무언가를 강조 표시할 수는 있지만 어떤 문자가 무엇인지 알 수 없습니다. 둘째, OCR의 텍스트 레이어에는 검색 중인 특정 단어에 오류가 있을 수 있습니다. 셋째, 일부 PDF는 표준 검색 동작과 일치하지 않는 유니코드 문자나 특수 인코딩을 사용합니다.
인코딩 문제의 경우 PDF 변환기를 통해 PDF를 실행하여 텍스트를 추출하고 다시 포함하면 문자 매핑 문제가 해결되는 경우가 있습니다. 깨끗한 재인코딩 단계를 통해 텍스트를 강제로 변환하는 Word로 변환한 다음 PDF로 다시 내보내면 손상된 글꼴 인코딩으로 인해 발생한 검색 문제를 해결할 수도 있습니다.
향후 검사 시 문제 예방
검색 가능해야 하는 문서를 정기적으로 스캔하는 경우 나중에 추가하기보다는 스캔 작업 흐름에 OCR을 구축하세요. 대부분의 최신 스캐너 소프트웨어에는 OCR을 자동으로 적용하고 검색 가능한 PDF를 직접 저장하는 옵션이 있습니다. Microsoft Lens, Adobe Scan, Google Drive의 카메라 기능과 같은 휴대폰 스캔 앱은 모두 기본적으로 OCR을 적용하고 별도의 처리 단계 없이 처음부터 검색 가능한 PDF를 생성합니다.
PDF OCR을 사용해 보세요.
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
