Het enige exemplaar van een contract van drie jaar geleden is een PDF die nu wordt geopend met een foutmelding. Een onderzoeksrapport dat is gedownload van een inmiddels ter ziele gegane website zal niets anders weergeven dan pagina vier. De ondertekende overeenkomst van een klant is opgeslagen op een schijf waarop fouten zijn opgetreden, en het herstelde bestand is gedeeltelijk beschadigd. Deze situaties zijn stressvol, maar ze zijn niet altijd hopeloos. Tekstherstel van beschadigde PDFs is vaker mogelijk dan mensen verwachten. De vraag is welke aanpak je het eerst moet proberen.

Begrijp met wat voor soort schade u te maken heeft
Niet alle PDF-schade is hetzelfde en de herstelaanpak hangt af van wat er mis is gegaan. Een paar snelle observaties vertellen je veel:
- Bestand wil helemaal niet openen: de bestandskop of interne structuur is beschadigd. Een reparatietool moet de bestandsstructuur reconstrueren voordat toegang tot de inhoud kan worden verkregen.
- Bestand wordt geopend, maar sommige pagina's zijn leeg of ontbreken: gedeeltelijke corruptie: de bestandsstructuur is intact, maar sommige inhoudsobjecten zijn beschadigd of ontbreken. Herstel kan de onbeschadigde delen terughalen.
- Tekst wordt weergegeven als symbolen of onleesbare tekens: lettertypecodering beschadigd. De tekstgegevens zijn mogelijk intact, maar de afbeelding tussen tekens en glyphs is verbroken.
- Bestand is erg klein (een paar KB terwijl het veel groter zou moeten zijn): onvolledige download of overdracht. Het bestand is nooit volledig ontvangen; het verkrijgen van een nieuw exemplaar van de bron is de oplossing, niet de reparatie.
Probeer Reparatie PDF
Geen installatie nodig. Werkt rechtstreeks in uw browser.
Probeer eerst een andere PDF-viewer
Sommige bestanden die in de ene viewer mislukken, worden met succes geopend in een andere. Adobe Reader, de ingebouwde PDF-viewer van Chrome, Apple Preview, Foxit en Sumatra PDF gebruiken allemaal verschillende weergave-engines. Een bestand dat de ene engine niet kan parseren, valt mogelijk binnen de hersteltolerantie van een andere engine.
Als een kijker het bestand opent (zelfs gedeeltelijk) probeer dan onmiddellijk alle zichtbare tekst (Ctrl+A en vervolgens Ctrl+C) te kopiëren en in een Word-document te plakken. Hiermee wordt alle tekst vastgelegd die toegankelijk is in de huidige staat van het bestand, ongeacht of de bestandsstructuur herstelbaar is. Een onvolmaakte tekstextractie is beter dan niets, en zelfs uit een aanzienlijk beschadigd bestand kan de meeste inhoud worden vastgelegd.
Gebruik een PDF reparatietool
Een speciale Repair PDF tool probeert de interne bestandsstructuur te reconstrueren door het beschadigde bestand te scannen op herstelbare inhoudsobjecten (tekststreams, afbeeldingen, paginadefinities) en een geldige PDF opnieuw op te bouwen op basis van wat het maar kan vinden. Dit is iets anders dan simpelweg het bestand openen; reparatietools zoeken specifiek naar structurele schade en werken deze rond.
De reparatietool van WukongPDF op www.wukongpdf.com regelt dit: upload het beschadigde bestand, laat het reparatieproces draaien en download wat herstelbaar is. Voor gedeeltelijk beschadigde bestanden waarvan de meeste inhoud intact is, maar de bestandsstructuur verbroken is, levert dit vaak een volledig leesbare PDF op. Bij zwaar beschadigde bestanden kan het gedeelte van de inhoud herstellen. De output hangt af van hoeveel van de onderliggende gegevens de schade hebben overleefd.
Extraheer tekst rechtstreeks uit het bestand Gegevens
PDF-bestanden slaan tekst op in stromen binnen de bestandsstructuur. Zelfs als de PDF-structuur zo beschadigd is dat een kijker het document niet kan weergeven, kunnen de tekststromen nog steeds intact en leesbaar zijn met de juiste hulpmiddelen. Voor technisch zelfverzekerde gebruikers kan het openen van de PDF in een teksteditor (geen PDF-viewer) leesbare tekstinhoud onthullen die is ingebed in de onbewerkte gegevens van het bestand - zoek naar reeksen leesbare tekens tussen de binaire inhoud.
Opdrachtregelprogramma's zoals pdftotext (onderdeel van het poppler-pakket) kunnen tekst uit PDFs extraheren die niet in standaardviewers wordt geopend. Als u pdftotext op een beschadigd bestand uitvoert, wordt soms aanzienlijke tekstinhoud hersteld, zelfs als de visuele weergave volledig mislukt. Deze aanpak vereist comfort met opdrachtregelprogramma's, maar kan toegang krijgen tot inhoud die GUI-hulpmiddelen missen.
Speciaal geval: beschadigd gescand PDFs
Gescande PDFs slaan inhoud op als afbeeldingen in plaats van als tekst. Als de afbeeldingsgegevens in een gescande PDF beschadigd zijn, helpen de hulpmiddelen voor tekstextractie niet; er is geen tekstlaag om te extraheren. De herstelbare inhoud zijn de afbeeldingsgegevens zelf.
Voor gedeeltelijk beschadigde gescande PDFs kan een reparatietool die de afbeeldingsobjecten herstelt een zichtbaar document produceren, zelfs als de bestandsstructuur kapot is. Na de reparatie wordt de afbeeldingsinhoud door het uitvoeren van OCR op het herstelde document geconverteerd naar doorzoekbare tekst, waardoor de herstelde versie bruikbaarder wordt dan de oorspronkelijke, niet-doorzoekbare scan.
Wat herstel wel en niet kan doen
Tekstherstel van beschadigde PDFs is niet gegarandeerd. Het succespercentage is afhankelijk van het type en de omvang van de schade:
- Structurele corruptie met intacte inhoud: hoog herstelpercentage: de inhoud is aanwezig, maar het bestand kan deze gewoon niet correct weergeven
- Gedeeltelijke inhoudsschade: gedeeltelijk herstel: sommige pagina's of secties kunnen worden hersteld, andere zijn verloren gegaan
- Overschreven opslagsectoren: weinig tot geen herstel: als de onderliggende gegevens zijn overschreven, kan geen enkele tool deze opnieuw creëren
- Onvolledige download (bestand is alleen afgekapt): zorg voor een nieuwe kopie in plaats van te proberen het te repareren
De les voor de toekomst: bewaar van elk document dat er toe doet meerdere exemplaren op verschillende locaties. Een back-up op een andere schijf, een kopie in de cloudopslag, een e-mail aan uzelf: elk van deze biedt een herstelpad dat PDF-reparatietools overbodig maakt. Het beste Reparatie PDF scenario is er een die u nooit hoeft te gebruiken.
Probeer Reparatie PDF
Geen installatie nodig. Werkt rechtstreeks in uw browser.
