Others

Kunt u een gescande PDF naar Excel converteren?

Ja, maar het vereist een extra stap vergeleken met het converteren van een digitaal gemaakte PDF. Een gescande PDF is een afbeelding en geen document met gestructureerde gegevens. Het conversieproces moet dus eerst de tekst en cijfers in de afbeelding herkennen voordat deze in spreadsheetcellen kan worden geplaatst. Wanneer dit goed werkt, is de tijdwinst aanzienlijk. Als dat niet het geval is, is opruimen nodig.

Can You Convert a Scanned PDF to Excel?

Waarom gescande PDFs anders zijn

Een digitaal gemaakte PDF slaat gegevens op als echte tekens: cijfers die direct kunnen worden gelezen en in cellen kunnen worden geplaatst. Een gescande PDF slaat pagina's op als foto's. De "cijfers" in een gescande tabel bevinden zich pixels die op cijfers lijken. Om ze in Excel te extraheren, moet software naar die pixels kijken, bepalen welke tekens ze vertegenwoordigen en vervolgens de structuur van de tabel uitzoeken: welke pixels rijen vormen, welke kolommen vormen, waar celgrenzen zich bevinden.

Dit proces – optische tekenherkenning gecombineerd met detectie van de tabelstructuur – is complexer dan een eenvoudige conversie van PDF naar Excel en biedt meer kans op fouten.

WukongPDF

Probeer PDF naar Excel

Geen installatie nodig. Werkt rechtstreeks in uw browser.

Nu beginnen →

Wat de conversiekwaliteit beïnvloedt

Scankwaliteit is de grootste factor. Een schone, contrastrijke scan van een duidelijk afgedrukte tabel met meer dan 200 DPI converteert goed: de OCR leest de tekens nauwkeurig en de tabelstructuur is herkenbaar. Een scan met een lage resolutie, een vervaagd document, een scheve pagina of handgeschreven cijfers in welke cel dan ook leveren aanzienlijk slechtere resultaten op.

De complexiteit van de tabelstructuur is ook van belang. Een eenvoudig raster met duidelijke randen en consistente rijhoogten converteert betrouwbaarder dan een complexe tabel met samengevoegde cellen, met kopteksten, geneste subtabellen of rijen met verschillende hoogtes. Een eenvoudiger structuur betekent dat de conversiesoftware minder beslissingen hoeft te nemen, en dat er minder kansen zijn dat die beslissingen verkeerd zijn.

Hoe het te doen

De PDF naar Excel-tool van WukongPDF verwerkt gescande PDFs rechtstreeks: de OCR-stap wordt automatisch uitgevoerd als onderdeel van de conversie. Upload de gescande PDF, selecteer Excel als uitvoerformaat en download. Voor schone scans van goed gestructureerde tabellen is de uitvoer vaak bruikbaar met minimale opschoning. Open het Excel-bestand, bekijk de gegevens, corrigeer eventuele OCR-fouten (verkeerd gelezen tekens, samengevoegde of gesplitste cellen) en de spreadsheet is klaar voor gebruik.

Adobe Acrobat Pro heeft een bijzonder sterke conversie van gescande PDF naar Excel, met betere tabeldetectie dan de meeste gratis tools. Als u er toegang toe heeft en het document complex is, is het de moeite waard om het voor de eerste conversie te gebruiken, zelfs als u elders opruimt.

Wat u moet controleren na de conversie

Vertrouw nooit een gescande PDF-conversie zonder beoordeling, vooral niet als het om numerieke gegevens gaat. OCR verwart vaak bepaalde tekenparen: 0 en O, 1 en l, 5 en S, 8 en B. Een financiële tabel waarin enkele nullen als de letter O worden gelezen, zal gebroken formules en onjuiste totalen bevatten. Vergelijk de belangrijkste cijfers met de originele scan voordat u de gegevens voor iets belangrijks gebruikt.

Controleer de uitlijning van de kolommen: bij conversie worden gegevens soms in de verkeerde kolom geplaatst als de oorspronkelijke tabel een onregelmatige spatiëring of samengevoegde cellen had. Vergelijk de structuur van de Excel-uitvoer pagina voor pagina met de originele scan, en controleer niet alleen de individuele waarden.

Wanneer handmatige invoer sneller is

Voor zeer korte tabellen (minder dan 20 rijen) of tabellen met een complexe structuur die slecht converteren, is handmatige gegevensinvoer soms sneller dan conversie plus opschonen. Het typen van een tabel met 10 rijen en 5 kolommen duurt ongeveer drie minuten; als de conversie een resultaat oplevert dat een aanzienlijke correctie vereist, heeft u meer tijd besteed dan bij directe invoer.

De conversieaanpak loont het duidelijkst bij lange tabellen: tientallen of honderden rijen waarbij handmatige invoer uren zou duren. Hiervoor is zelfs een imperfecte conversie met opschoning bijna altijd sneller dan helemaal opnieuw beginnen.

WukongPDF

Probeer PDF naar Excel

Geen installatie nodig. Werkt rechtstreeks in uw browser.

Nu beginnen →