이미지를 검색 가능한 PDF로 변환하는 과정은 2단계 프로세스입니다. 먼저 이미지가 PDF가 된 다음 OCR이 텍스트 레이어를 추가하여 콘텐츠를 검색하고 선택할 수 있습니다. 두 단계 모두 이를 지원하는 도구에서 함께 수행할 수 있으며, 각 단계에 대해 더 많은 제어를 원하는 경우 별도로 수행할 수도 있습니다.

일반 이미지 PDF와 검색 가능한 이미지의 차이점
OCR 없이 이미지를 PDF로 변환하면 이미지를 표시하는 PDF가 생성됩니다. 이미지를 열고, 확대하고, 인쇄할 수 있지만 텍스트를 선택하거나, 단어를 검색하거나, 내용을 복사할 수는 없습니다. 본질적으로 PDF 컨테이너에 싸인 사진입니다. 검색 가능한 PDF는 이미지의 텍스트를 OCR로 읽어 이미지 아래에 숨겨진 텍스트 레이어를 추가합니다. 시각적인 모양은 변경되지 않았지만 이제 Ctrl+F로 단어를 찾고 텍스트를 복사할 수 있습니다.
PDF OCR을 사용해 보세요.
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
두 단계를 동시에 수행
WukongPDF의 OCR PDF 도구는 기존 PDF뿐만 아니라 이미지를 직접 허용합니다. JPG, PNG 또는 TIFF 파일을 업로드하면 도구가 이를 PDF로 변환하고 한 단계로 OCR을 실행하여 검색 가능한 PDF를 반환합니다. 이는 기존 PDF가 아닌 이미지 파일에서 시작할 때 가장 효율적인 경로입니다.
Google Drive도 이 작업을 한 단계로 처리합니다. 즉, 이미지를 Drive에 업로드하고 마우스 오른쪽 버튼으로 클릭한 다음 Open with → Google Docs를 선택합니다. 드라이브는 이미지를 변환하고 자동으로 OCR을 실행합니다. 결과는 검색 가능한 PDF가 아닌 편집 가능한 Google Docs 문서이지만 필요한 경우 거기에서 PDF로 다운로드할 수 있습니다.
이미지 품질에 따라 OCR 정확도가 결정됩니다
OCR은 픽셀을 읽습니다. 입력 이미지의 품질에 따라 텍스트가 얼마나 정확하게 인식되는지 직접적으로 결정됩니다. 200DPI 이상으로 인쇄된 문서의 선명하고 대비가 높은 사진은 일반적으로 매우 높은 정확도로 변환됩니다. 조명이 좋지 않은 곳에서 비스듬히 찍은 흐릿한 휴대폰 사진에는 어떤 OCR 엔진을 사용하든 관계없이 많은 오류가 발생합니다.
검색 가능한 PDF를 만들기 위해 실제 문서를 촬영하는 경우 몇 가지 사항으로 인해 결과가 크게 향상됩니다. 페이지 전체에 그림자가 없이 균일하고 균일한 조명; 각도가 아닌 문서 바로 위에 카메라가 있습니다. 문서가 구부러지지 않고 편평하게 놓여 있습니다. Microsoft Lens 및 Adobe Scan과 같은 휴대폰 스캐닝 앱은 OCR 전에 자동 원근 교정 및 대비 향상을 적용하므로 표준 카메라 사진보다 더 나은 결과를 생성하는 경우가 많습니다.
출력 확인
변환 후 PDF를 열고 문서에서 볼 수 있는 단어로 Ctrl+F를 눌러 OCR이 작동했는지 확인하세요. 발견되면 텍스트 레이어가 작동하는 것입니다. 구절을 선택하고 복사해 보십시오. 텍스트 편집기에 붙여넣어 문자가 깨지지 않고 올바른지 확인하십시오. 보관하거나 검색에 의존할 문서의 경우 OCR 정확성을 위해 몇 페이지를 무작위로 검사하는 것은 몇 분 정도 소요되는 가치가 있습니다.
OCR 후 PDF 압축 전달은 파일 크기를 줄이는 데도 도움이 될 수 있습니다. 전체 해상도 이미지와 포함된 텍스트 레이어를 결합하면 특히 여러 페이지 이미지 스캔의 경우 예상보다 더 큰 파일을 생성할 수 있습니다.
PDF OCR을 사용해 보세요.
설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.
