Others

PDF를 오디오 파일로 변환할 수 있나요?

예 — PDF를 오디오로 변환하는 작업은 2단계 프로세스입니다. 즉, 텍스트를 추출한 다음 텍스트 음성 변환을 통해 실행합니다. 기술이 크게 향상되었으며 결과는 대부분의 목적에 사용할 수 있습니다. 하지만 PDF 생성 방법과 사용하는 텍스트 음성 변환 엔진에 따라 경험이 많이 달라집니다.

Can You Convert a PDF to an Audio File?

직접 PDF-오디오 변환이 없는 이유

PDF에는 오디오 데이터가 포함되어 있지 않으며 텍스트, 이미지 및 레이아웃 정보가 포함되어 있습니다. PDF를 오디오로 변환한다는 것은 PDF에서 텍스트를 추출한 다음 해당 텍스트에서 음성을 합성하는 것을 의미합니다. 이는 두 가지 별도의 작업이므로 어떤 도구도 PDF를 한 단계로 직접 MP3로 변환할 수 없습니다. 이 작업에는 항상 텍스트 추출과 텍스트 음성 변환 합성이 포함됩니다.

출력 품질은 텍스트 추출 품질에 따라 크게 달라집니다. 깔끔하고 적절하게 구성된 텍스트가 포함된 PDF는 자연스럽게 흐르는 오디오를 생성합니다. 스캔한 이미지이거나 손상된 텍스트 인코딩이 있거나 비정상적인 형식을 사용하는 PDF는 잘못 읽은 단어, 순서가 잘못된 조각 또는 잘못된 구절과 같은 오류가 있는 오디오를 생성합니다.

WukongPDF

PDF OCR을 사용해 보세요.

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →

내장 OS TTS(텍스트 음성 변환) 사용

Mac에서 가장 간단한 방법: PDF를 열고 모든 텍스트(Cmd+A)를 선택한 다음 편집 → 말하기 → 말하기 시작으로 이동합니다. Mac에 내장된 텍스트 음성 변환 기능은 선택한 콘텐츠를 소리내어 읽어줍니다. 이것은 저장할 수 있는 오디오 파일이 아닙니다. 실시간 재생이지만 다른 작업을 하면서 PDF를 듣기 위해서는 추가 도구 없이도 작동합니다.

Windows에서 내레이터(내장 화면 판독기)는 파일이 PDF 뷰어에서 열릴 때 PDF 콘텐츠를 소리내어 읽을 수 있습니다. 읽기를 시작하는 단축키는 Ctrl+Windows+Enter입니다. 다시 말하지만 이는 저장할 수 있는 파일이 아니라 실시간 재생입니다.

PDF 텍스트에서 오디오 파일 만들기

오프라인으로 듣거나 공유할 수 있는 실제 오디오 파일(MP3, M4A, WAV)을 생성하기 위한 작업 흐름은 PDF에서 텍스트를 추출하여 텍스트 음성 변환 서비스에 붙여넣고 오디오 출력을 다운로드하는 것입니다. 여러 서비스가 이를 직접 처리합니다.

Natural Reader, Speechify 및 Balabolka(Windows, 무료)는 텍스트 입력을 허용하고 오디오 파일을 내보냅니다. Google의 TTS(텍스트 음성 변환) API와 Amazon Polly는 프로그래밍 방식으로 고품질의 자연스러운 오디오를 생성합니다. 완전한 PDF의 경우 텍스트를 장별로 또는 섹션별로 복사하고, 각 부분을 변환하고, 필요한 경우 오디오 파일을 결합하세요.

PDF 선택 가능한 텍스트가 있어야 합니다

텍스트 추출은 PDF에 실제 텍스트 레이어가 있는 경우에만 작동합니다. 이미지 전용인 스캔된 PDF의 경우 먼저 OCR PDF을 실행하여 검색 가능한 텍스트 레이어를 추가한 다음 텍스트 추출 및 오디오 변환을 진행하세요. OCR이 없으면 텍스트 음성 변환 시스템은 읽을 내용이 없습니다. 파일에는 텍스트가 없고 픽셀만 있습니다.

빠른 테스트: PDF에서 문장을 선택해 보세요. 개별 단어가 강조 표시되면 텍스트 레이어가 존재하는 것입니다. 대신 페이지의 직사각형 영역을 선택하는 경우 이미지 전용이며 오디오 변환이 가능하려면 OCR이 필요합니다.

예상되는 한계

깨끗한 텍스트 추출과 좋은 텍스트 음성 변환을 사용하더라도 PDF-오디오 변환에는 알려진 제한 사항이 있습니다. 표와 그림은 의미 있게 오디오로 변환되지 않습니다. 표를 읽는 텍스트 음성 변환 엔진은 문서 순서에 따라 셀별로 읽는데, 이는 종종 임의의 숫자 목록처럼 들립니다. 각주와 사이드바가 PDF의 텍스트 레이어에서 해당 위치에 있으면 문장 중간에서 읽을 수 있습니다. 수학 표기법, 화학식, 코드 블록은 의미 있는 내용이 아닌 개별 문자로 읽혀집니다.

기사, 보고서, 책, 제안서 등 서술형 텍스트의 경우 오디오 변환이 잘 작동하고 출력이 실제로 들을 수 있습니다. 구조가 복잡하거나 기술적인 문서의 경우 문서를 직접 읽는 것보다 오디오를 따라가는 데 더 많은 주의가 필요할 수 있습니다.

WukongPDF

PDF OCR을 사용해 보세요.

설치가 필요하지 않습니다. 브라우저에서 직접 작동합니다.

시작하기 →