Tips & Tricks

Een tabel kopiëren van een PDF naar Excel

Een PDF met een gegevenstabel lijkt gemakkelijk naar Excel te kopiëren - totdat u het probeert en ontdekt dat de gegevens eruit komen als een warboel in een enkele kolom, of met regeleinden op de verkeerde plaatsen, of samengevoegde cellen die niet overeenkomen met de oorspronkelijke tabelstructuur. Om tabelgegevens netjes van PDF naar Excel te krijgen, moet u weten welke methode werkt voor uw specifieke PDF-type.

How to Copy a Table From a PDF to Excel

Waarom kopiëren en plakken meestal rommelige resultaten oplevert

PDF slaat tabelinhoud op als gepositioneerde tekst: individuele tekstelementen die op specifieke coördinaten op de pagina zijn geplaatst, niet als gestructureerde tabelgegevens met rijen en kolommen. Wanneer u kopieert en plakt vanuit een PDF, kopieert u tekst in de volgorde waarin deze verschijnt in de interne structuur van het bestand, wat mogelijk niet overeenkomt met de visuele leesvolgorde. Een tabel met drie kolommen en tien rijen kan worden geplakt als dertig regels tekst zonder kolomscheiding.

Sommige PDF-viewers kunnen beter omgaan met tabeldetectie tijdens het plakken dan andere. De kopie van Adobe Acrobat Reader levert doorgaans betere resultaten op dan browsergebaseerde viewers. Maar voor complexe tabellen is kopiëren en plakken zelden schoon genoeg om te gebruiken zonder aanzienlijke handmatige opschoning.

WukongPDF

Probeer PDF naar Excel

Geen installatie nodig. Werkt rechtstreeks in uw browser.

Nu beginnen →

De beste methode: converteer PDF rechtstreeks naar Excel

Een speciale PDF naar Excel converter analyseert de lay-out van de PDF, identificeert tabelstructuren en wijst de inhoud toe aan spreadsheetcellen. Het resultaat is een Excel-bestand waarin de tabelrijen en -kolommen overeenkomen met de originele PDF-indeling – veel schoner dan kopiëren en plakken.

De PDF naar Excel-tool van WukongPDF op www.wukongpdf.com regelt dit: upload de PDF, download het Excel-bestand. Voor digitale PDFs met een duidelijke tabelstructuur is de conversie meestal schoon genoeg om met minimale correctie te gebruiken. Voor complexe tabellen met samengevoegde cellen, geneste kopteksten of een onregelmatige structuur is nog steeds enige handmatige opruiming nodig, maar veel minder dan bij kopiëren en plakken.

Gescande PDFs: eerst OCR, daarna converteren

Als de PDF met de tabel een scan is (een afbeelding van een pagina in plaats van een digitaal document), zal kopiëren en plakken helemaal niet werken (er is geen tekst om te kopiëren) en zal directe conversie slechte resultaten opleveren. Gescande tabellen hebben eerst OCR-verwerking nodig om echte tekst te extraheren, en vervolgens moet de tekst worden geïnterpreteerd als tabelstructuur.

Sommige PDF-naar-Excel-converters passen OCR automatisch toe wanneer ze een gescand document detecteren. Bij andere moet u eerst OCR uitvoeren en vervolgens converteren. Controleer de kwaliteit van de scan voordat u probeert te converteren; tabellen met duidelijke rij- en kolomgrenzen worden beter geconverteerd dan tabellen met vage lijnen of onregelmatige spatiëring.

Adobe Acrobat Pro: exporteren naar Excel

Adobe Acrobat Pro heeft een ingebouwde functie Exporteren naar Excel (Bestand > Exporteren naar > Spreadsheet > Microsoft Excel-werkmap). Dit is een van de meest nauwkeurige tools voor het extraheren van tabellen die beschikbaar zijn. Het algoritme voor tabeldetectie van Acrobat is volwassen en kan een breed scala aan tabeltypen verwerken.

Bij de export wordt een Excel-bestand gemaakt waarin elke tabel op elke pagina in een afzonderlijk werkblad of sectie wordt geplaatst. Complexe tabellen met meerdere pagina's, tabellen met herhalende kopteksten en tabellen met samengevoegde cellen worden allemaal redelijk goed afgehandeld. Als u Acrobat Pro beschikbaar heeft, is dit de optie van de hoogste kwaliteit voor het extraheren van tabellen.

Als kopiëren en plakken de enige optie is: hoe u dit kunt opruimen

Als er geen conversietool beschikbaar is en u kopiëren en plakken moet gebruiken, minimaliseren deze stappen het opruimwerk:

  • Selecteer in Adobe Reader de tabeltekst en gebruik Bewerken > Kopiëren met opmaak, indien beschikbaar: hierdoor blijft meer van de tabelstructuur behouden dan bij een gewone kopie
  • Plak eerst in een teksteditor (Kladblok, Teksteditor), niet rechtstreeks in Excel. Hierdoor kunt u de onbewerkte structuur zien zonder dat de celopmaak van Excel de zaken ingewikkelder maakt
  • Kopieer de tekst uit de teksteditor en plak deze in Excel met behulp van Plakken speciaal > Tekst
  • Gebruik de functie Tekst naar kolommen van Excel (Gegevens > Tekst naar kolommen) om de geplakte gegevens in afzonderlijke kolommen te splitsen op basis van een scheidingsteken of vaste breedtes

Wanneer geen enkel gereedschap een schoon resultaat oplevert

Sommige tabellen zijn echt moeilijk voor geautomatiseerde tools: geneste tabellen binnen tabellen, tabellen met complexe samengevoegde celpatronen, tabellen die meerdere pagina's beslaan met herhalende kopteksten, of tabellen waarin gegevens visueel zijn gestructureerd zonder formele tabelopmaak in de PDF. Hiervoor kan de meest praktische aanpak het handmatig invoeren van gegevens zijn, waarbij de PDF als referentie wordt gebruikt. Voor kleine tabellen kost dit minder tijd dan proberen een geautomatiseerd hulpmiddel te dwingen een schoon resultaat te produceren en vervolgens alle fouten handmatig te herstellen.

WukongPDF

Probeer PDF naar Excel

Geen installatie nodig. Werkt rechtstreeks in uw browser.

Nu beginnen →