Others

내 PDF에서 텍스트를 복사할 수 없는 이유는 무엇입니까?

PDF에서 텍스트가 복사되지 않는 데에는 완전히 다른 세 가지 이유가 있으며 각 이유에는 다른 해결 방법이 있습니다. 하나를 해결하는 접근 방식은 다른 문제에는 도움이 되지 않으므로 현재 처한 상황을 진단하면 좌절감을 많이 줄일 수 있습니다.

Why Can't I Copy Text From My PDF?

이유 1: PDF는 스캔된 이미지입니다

이것이 가장 일반적인 원인입니다. 실제 문서를 스캔하면 스캐너가 페이지의 사진을 찍고 해당 사진을 PDF 컨테이너에 저장합니다. 화면에 표시되는 텍스트는 선택하거나 복사할 수 있는 실제 텍스트 문자가 아닌 이미지의 일부(문자처럼 보이도록 배열된 픽셀)입니다. 그것을 클릭하는 것은 사진에서 텍스트를 복사하는 것과 같습니다.

빠른 테스트: 단일 단어를 강조 표시하려면 클릭하고 드래그해 보세요. 개별 단어나 문자를 강조표시할 수 있다면 파일에 실제 텍스트가 있는 것입니다. 커서가 이미지의 직사각형을 선택하는 것처럼 작동하고 페이지 콘텐츠 상자만 선택할 수 있다면 이는 스캔된 이미지입니다.

해결책은 OCR(광학 문자 인식)입니다. OCR 소프트웨어는 이미지를 분석하고, 텍스트를 식별하고, 검색, 선택 및 복사할 수 있는 PDF에 실제 텍스트 레이어를 추가합니다. OCR이 실행된 후 문서는 동일해 보이지만 일반적인 PDF처럼 동작합니다. WukongPDF의 OCR PDF 도구는 브라우저에서 이 작업을 수행합니다. 즉, 스캔한 PDF을 업로드하고 처리한 후 검색 가능한 버전을 다운로드합니다.

WukongPDF

PDF OCR을 사용해 보세요.

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →

이유 2: 문서 소유자에 의해 복사가 제한되었습니다

PDF에는 작성자가 독자가 문서로 수행할 수 있는 작업을 제한할 수 있는 권한 시스템이 있습니다. 이러한 제한 사항 중 하나는 복사입니다. 소유자는 읽기를 허용할 수 있지만 텍스트 선택 및 복사는 차단할 수 있습니다. 이 제한이 설정되면 화면의 텍스트를 보고 읽을 수 있지만 선택하려고 하면 아무 것도 강조 표시되지 않거나 붙여 넣을 때 아무 것도 나오지 않습니다.

이러한 경우인지 확인할 수 있습니다. 대부분의 PDF 뷰어에서는 파일 → 속성 또는 문서 속성으로 이동한 다음 보안 또는 권한 탭을 확인하세요. 허용되는 항목과 제한되는 항목이 나열됩니다. "콘텐츠 복사"인 경우 허용되지 않음으로 표시되면 복사 제한이 활성화된 것입니다.

이 제한을 제거할 수 있는지 여부는 비밀번호가 있는지 여부에 따라 다릅니다. 자신의 문서이고 비밀번호를 기억하는 경우 PDF 편집기를 사용하면 비밀번호로 문서를 열고 제한 사항을 제거할 수 있습니다. 다른 사람이 보낸 문서이고 의도적으로 복사를 제한한 경우에는 제한되지 않은 버전을 보내달라고 요청해야 합니다.

이유 3: 텍스트가 복사되지만 왜곡되어 나옵니다

때로는 기술적으로는 복사가 가능하지만 붙여넣은 내용은 임의의 문자, 기호 또는 잘못된 순서의 텍스트와 같은 쓰레기입니다. 글꼴 인코딩 문제입니다. 일부 PDF는 비표준 문자 매핑이 포함된 사용자 정의 또는 내장 글꼴을 사용합니다. PDF 뷰어는 글꼴을 사용하여 텍스트를 시각적으로 렌더링할 수 있지만 기본 문자 코드를 복사하려고 하면 표시되는 문자와 일치하지 않습니다.

이러한 문제는 이전 PDF, 특정 디자인 소프트웨어에서 생성된 문서 또는 비정상적인 글꼴 인코딩을 사용한 파일에서 가장 자주 발생합니다. 신뢰할 수 있는 유일한 수정 방법은 문서에서 OCR을 실행하여 시각적 콘텐츠를 다시 읽고 새롭고 올바른 텍스트 레이어를 만드는 것입니다. 이렇게 하면 손상된 인코딩이 깨끗하고 복사 가능한 텍스트로 대체됩니다.

텍스트를 복사했지만 서식 문제가 있는 경우

약간 다른 문제: 텍스트는 올바르게 복사되지만 잘못된 줄 바꿈, 단어 병합 또는 공백 누락이 발생합니다. 이는 PDF 텍스트 추출의 정상적인 동작입니다. PDF는 Word 문서처럼 흐르는 단락이 아니라 페이지에 배치된 문자로 텍스트를 저장합니다. 텍스트 열이나 다중 열 레이아웃을 복사할 때 추출기는 한 줄이 끝나고 다른 줄이 시작되는 위치를 항상 알 수는 없습니다.

텍스트 양이 적은 경우 일반적으로 수동 정리가 가장 빠른 솔루션입니다. 예를 들어 전체 보고서의 내용을 추출하는 대용량의 경우 PDF 변환기 도구를 사용하여 PDF를 Word로 변환하면 복사하여 붙여넣는 것보다 더 깔끔한 결과를 얻을 수 있습니다. 변환 프로세스에서는 원시 문자 위치를 추출하는 대신 문서 구조를 보존하려고 하기 때문입니다.

올바른 수정 방법을 선택하는 방법

수정 사항을 진단과 일치시킵니다.

  • 텍스트를 선택할 수 없습니다. 커서가 이미지처럼 동작합니다. → OCR 실행
  • 화면에서 텍스트를 선택할 수 있지만 붙여넣을 수 없습니다. → 문서 권한을 확인하고 제한된 경우 보낸 사람에게 문의하세요.
  • 왜곡된 문자로 붙여넣기 → OCR을 실행하여 텍스트 레이어를 다시 작성
  • 올바르게 복사되지만 형식이 잘못되었습니다. → 큰 추출의 경우 Word로 변환하고, 작은 추출의 경우 수동으로 정리합니다.

OCR 경로는 네 가지 경우 중 세 가지를 해결하므로 일반적으로 무슨 일이 일어나고 있는지 확실하지 않은 경우 가장 먼저 시도하는 것입니다. OCR을 통해 스캔된 PDF는 일반 텍스트 문서처럼 작동하며 검색, 선택 및 복사가 가능합니다.

WukongPDF

PDF OCR을 사용해 보세요.

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →