Kunt u een PDF naar een audiobestand converteren?

Ja, het converteren van een PDF naar audio bestaat uit twee stappen: extraheer de tekst en voer deze vervolgens uit via tekst-naar-spraak. De technologie is aanzienlijk verbeterd en de resultaten zijn bruikbaar voor de meeste doeleinden, hoewel de ervaring sterk varieert, afhankelijk van hoe de PDF is gemaakt en welke tekst-naar-spraak-engine u gebruikt.

Waarom er geen directe conversie van PDF naar audio is

PDFs bevatten geen audiogegevens; ze bevatten tekst, afbeeldingen en lay-outinformatie. Het converteren van een PDF naar audio betekent dat u de tekst uit de PDF haalt en vervolgens de spraak uit die tekst synthetiseert. Dit zijn twee afzonderlijke bewerkingen en daarom converteert geen enkele tool PDF in één stap rechtstreeks naar MP3: het gaat altijd om tekstextractie gevolgd door tekst-naar-spraak-synthese.

De kwaliteit van de uitvoer is sterk afhankelijk van de kwaliteit van de tekstextractie. Een PDF met duidelijke, goed gestructureerde tekst produceert audio die op natuurlijke wijze stroomt. Een PDF die een gescande afbeelding is, een defecte tekstcodering heeft of een ongebruikelijke opmaak gebruikt, produceert audio met fouten: verkeerd gelezen woorden, fragmenten die in de verkeerde volgorde worden gelezen of onleesbare passages.

Probeer PDF OCR

Geen installatie nodig. Werkt rechtstreeks in uw browser.

Nu beginnen →

Het ingebouwde besturingssysteem gebruiken voor tekst-naar-spraak

De eenvoudigste aanpak op Mac: open de PDF, selecteer alle tekst (Cmd+A), ga naar Bewerken → Spraak → Begin met spreken. De ingebouwde tekst-naar-spraak van Mac leest de geselecteerde inhoud hardop voor. Dit is geen audiobestand dat je kunt opslaan – het is live afspelen – maar als je naar een PDF luistert terwijl je iets anders doet, werkt het zonder extra hulpmiddelen.

In Windows kan Verteller (de ingebouwde schermlezer) PDF-inhoud hardop voorlezen wanneer het bestand geopend is in een PDF-viewer. De sneltoets om te beginnen met lezen is Ctrl+Windows+Enter. Nogmaals, dit is live afspelen in plaats van een bestand dat u kunt opslaan.

Een audiobestand maken van PDF Tekst

Om een daadwerkelijk audiobestand (MP3, M4A, WAV) te produceren waar u offline naar kunt luisteren of delen, gaat de workflow als volgt: extraheer tekst uit de PDF, plak deze in een tekst-naar-spraakservice en download de audio-uitvoer. Verschillende diensten handelen dit rechtstreeks af.

Natural Reader, Speechify en Balabolka (Windows, gratis) accepteren tekstinvoer en exporteren audiobestanden. De tekst-naar-spraak-API van Google en Amazon Polly produceren programmatisch natuurlijk klinkende audio van hoge kwaliteit. Voor een volledige PDF kopieert u de tekst hoofdstuk voor hoofdstuk of sectie voor sectie, converteert u elk deel en voegt u indien nodig de audiobestanden samen.

PDF moet selecteerbare tekst bevatten

Tekstextractie werkt alleen als de PDF een echte tekstlaag heeft. Voor gescande PDFs met alleen afbeeldingen voert u eerst OCR PDF uit om een doorzoekbare tekstlaag toe te voegen en gaat u vervolgens verder met de tekstextractie en audioconversie. Zonder OCR heeft het tekst-naar-spraaksysteem niets te lezen: er staat geen tekst in het bestand, alleen pixels.

Een snelle test: probeer een zin te selecteren in de PDF. Als afzonderlijke woorden worden gemarkeerd, bestaat de tekstlaag. Als in plaats daarvan een rechthoekig gebied van de pagina wordt geselecteerd, bevat dit alleen afbeeldingen en is OCR nodig voordat audioconversie mogelijk is.

Te verwachten beperkingen

Zelfs met schone tekstextractie en goede tekst-naar-spraak kent de conversie van PDF naar audio bekende beperkingen. Tabellen en figuren worden niet betekenisvol naar audio vertaald: een tekst-naar-spraak-engine die een tabel leest, leest cel voor cel in documentvolgorde, wat vaak klinkt als een willekeurige lijst met getallen. Voetnoten en zijbalken kunnen midden in een zin worden gelezen als ze op die manier in de tekstlaag van PDF zijn geplaatst. Wiskundige notaties, chemische formules en codeblokken worden gelezen als individuele karakters in plaats van als betekenisvolle inhoud.

Voor verhalende tekst (artikelen, rapporten, boeken, voorstellen) werkt audioconversie goed en is de output echt luisterbaar. Bij zwaar gestructureerde of technische documenten kan het zijn dat de audio meer aandacht nodig heeft om te volgen dan het rechtstreeks lezen van het document.

Probeer PDF OCR

Geen installatie nodig. Werkt rechtstreeks in uw browser.

Nu beginnen →