Ja, maar het vereist een extra stap vergeleken met het converteren van een digitaal gemaakte PDF. Een gescande PDF is een afbeelding en geen document met gestructureerde gegevens. Het conversieproces moet dus eerst de tekst en cijfers in de afbeelding herkennen voordat deze in spreadsheetcellen kan worden geplaatst. Wanneer dit goed werkt, is de tijdwinst aanzienlijk. Als dat niet het geval is, is opruimen nodig.

Waarom gescande PDFs anders zijn
Een digitaal gemaakte PDF slaat gegevens op als echte tekens: cijfers die direct kunnen worden gelezen en in cellen kunnen worden geplaatst. Een gescande PDF slaat pagina's op als foto's. De "cijfers" in een gescande tabel bevinden zich pixels die op cijfers lijken. Om ze in Excel te extraheren, moet software naar die pixels kijken, bepalen welke tekens ze vertegenwoordigen en vervolgens de structuur van de tabel uitzoeken: welke pixels rijen vormen, welke kolommen vormen, waar celgrenzen zich bevinden.
Dit proces – optische tekenherkenning gecombineerd met detectie van de tabelstructuur – is complexer dan een eenvoudige conversie van PDF naar Excel en biedt meer kans op fouten.
Probeer PDF naar Excel
Geen installatie nodig. Werkt rechtstreeks in uw browser.
Wat de conversiekwaliteit beïnvloedt
Scankwaliteit is de grootste factor. Een schone, contrastrijke scan van een duidelijk afgedrukte tabel met meer dan 200 DPI converteert goed: de OCR leest de tekens nauwkeurig en de tabelstructuur is herkenbaar. Een scan met een lage resolutie, een vervaagd document, een scheve pagina of handgeschreven cijfers in welke cel dan ook leveren aanzienlijk slechtere resultaten op.
De complexiteit van de tabelstructuur is ook van belang. Een eenvoudig raster met duidelijke randen en consistente rijhoogten converteert betrouwbaarder dan een complexe tabel met samengevoegde cellen, met kopteksten, geneste subtabellen of rijen met verschillende hoogtes. Een eenvoudiger structuur betekent dat de conversiesoftware minder beslissingen hoeft te nemen, en dat er minder kansen zijn dat die beslissingen verkeerd zijn.
Hoe het te doen
De PDF naar Excel-tool van WukongPDF verwerkt gescande PDFs rechtstreeks: de OCR-stap wordt automatisch uitgevoerd als onderdeel van de conversie. Upload de gescande PDF, selecteer Excel als uitvoerformaat en download. Voor schone scans van goed gestructureerde tabellen is de uitvoer vaak bruikbaar met minimale opschoning. Open het Excel-bestand, bekijk de gegevens, corrigeer eventuele OCR-fouten (verkeerd gelezen tekens, samengevoegde of gesplitste cellen) en de spreadsheet is klaar voor gebruik.
Adobe Acrobat Pro heeft een bijzonder sterke conversie van gescande PDF naar Excel, met betere tabeldetectie dan de meeste gratis tools. Als u er toegang toe heeft en het document complex is, is het de moeite waard om het voor de eerste conversie te gebruiken, zelfs als u elders opruimt.
Wat u moet controleren na de conversie
Vertrouw nooit een gescande PDF-conversie zonder beoordeling, vooral niet als het om numerieke gegevens gaat. OCR verwart vaak bepaalde tekenparen: 0 en O, 1 en l, 5 en S, 8 en B. Een financiële tabel waarin enkele nullen als de letter O worden gelezen, zal gebroken formules en onjuiste totalen bevatten. Vergelijk de belangrijkste cijfers met de originele scan voordat u de gegevens voor iets belangrijks gebruikt.
Controleer de uitlijning van de kolommen: bij conversie worden gegevens soms in de verkeerde kolom geplaatst als de oorspronkelijke tabel een onregelmatige spatiëring of samengevoegde cellen had. Vergelijk de structuur van de Excel-uitvoer pagina voor pagina met de originele scan, en controleer niet alleen de individuele waarden.
Wanneer handmatige invoer sneller is
Voor zeer korte tabellen (minder dan 20 rijen) of tabellen met een complexe structuur die slecht converteren, is handmatige gegevensinvoer soms sneller dan conversie plus opschonen. Het typen van een tabel met 10 rijen en 5 kolommen duurt ongeveer drie minuten; als de conversie een resultaat oplevert dat een aanzienlijke correctie vereist, heeft u meer tijd besteed dan bij directe invoer.
De conversieaanpak loont het duidelijkst bij lange tabellen: tientallen of honderden rijen waarbij handmatige invoer uren zou duren. Hiervoor is zelfs een imperfecte conversie met opschoning bijna altijd sneller dan helemaal opnieuw beginnen.
Probeer PDF naar Excel
Geen installatie nodig. Werkt rechtstreeks in uw browser.
