Door een PDF naar CSV te converteren, worden gegevens in tabelvorm uit een document geëxtraheerd naar een door komma's gescheiden waardenbestand dat spreadsheettoepassingen en databases direct kunnen lezen. Het is vooral handig als u financiële overzichten, verkooprapporten, inventarislijsten of andere PDF met gegevens heeft waarmee u moet werken in Excel, Google Spreadsheets of een database. Er bestaat geen directe PDF-naar-CSV-tool die in alle gevallen betrouwbaar werkt; de beste aanpak hangt af van wat er in de PDF staat.

Waarom er geen eenvoudige conversie met één klik is
CSV is een gestructureerd formaat: gegevens georganiseerd in rijen en kolommen met duidelijke scheidingstekens. PDF is een visueel formaat: inhoud die op een pagina wordt geplaatst zonder inherente structuur. Om ertussen te converteren, moet worden afgeleid welke tekst in welke kolom en rij thuishoort, wat eerder een lay-outinterpretatieprobleem is dan een eenvoudige formaatconversie.
Een conversie van PDF naar Excel voert deze interpretatiestap uit: het analyseert de tabelstructuur en wijst de inhoud toe aan cellen. CSV is dan een secundaire stap: zodra gegevens in Excel staan, is opslaan als CSV een enkele menuoptie. Deze aanpak in twee stappen (PDF → Excel → CSV) is betrouwbaarder dan proberen rechtstreeks naar CSV te gaan.
Probeer PDF naar Excel
Geen installatie nodig. Werkt rechtstreeks in uw browser.
De aanbevolen workflow: PDF naar Excel naar CSV
Stap 1: Converteer de PDF naar Excel met behulp van de tool PDF naar Excel van WukongPDF op www.wukongpdf.com. Upload de PDF, download het .xlsx-bestand. Dit behandelt het moeilijke deel: het interpreteren van de tabelstructuur en het toewijzen van gegevens aan cellen.
Stap 2: Open het Excel-bestand en bekijk de gegevens. Controleer of de kolommen correct zijn gescheiden, of de kopteksten in de juiste rij staan en of er geen gegevens verkeerd zijn samengevoegd tussen de cellen. Los eventuele voor de hand liggende problemen op voordat u verdergaat.
Stap 3: Opslaan als CSV. Ga in Excel naar Bestand > Opslaan als, wijzig het bestandstype in CSV (door komma's gescheiden) en sla het op. Excel waarschuwt dat sommige functies niet compatibel zijn met CSV. Klik op OK. Het resultaat is een gewoon tekstbestand met komma's die de waarden scheiden, dat elke database- of spreadsheettoepassing kan importeren.
Gescande PDFs: OCR eerst
Als de PDF gescande tabellen bevat (afbeeldingen van pagina's in plaats van digitale tekst), werkt de conversie van PDF naar Excel niet zonder eerst OCR. De converter heeft daadwerkelijke tekst nodig om mee te werken, geen pixelafbeeldingen van tekst.
Voer eerst de Gescande PDF uit via een OCR-tool om een tekstlaag toe te voegen en probeer vervolgens de PDF-naar-Excel-conversie op de OCR-verwerkte versie. De nauwkeurigheid is afhankelijk van de scankwaliteit. Schone scans met een hoge resolutie van goed opgemaakte tabellen leveren veel betere resultaten op dan scans van slechte kwaliteit of scheve scans. Controleer na OCR en conversie de Excel-uitvoer zorgvuldig voordat u deze opslaat als CSV, aangezien OCR-fouten in cijfers met name problemen kunnen veroorzaken bij de downstream-verwerking.
Adobe Acrobat Pro gebruiken voor complexe tabellen
Voor complexe tabellen (meerdere tabellen per pagina, tabellen die pagina's omspannen, tabellen met samengevoegde cellen of onregelmatige structuren) levert de functie Exporteren naar spreadsheet van Adobe Acrobat Pro (Bestand > Exporteren naar > Spreadsheet > Microsoft Excel Workbook) vaak schonere resultaten op dan browsergebaseerde tools. Het tabeldetectiealgoritme van Acrobat is volwassen en kan beter omgaan met randgevallen.
Na het exporteren naar Excel vanuit Acrobat is de CSV-conversie hetzelfde: bekijk de gegevens, ruim eventuele problemen op en sla deze op als CSV. Het hebben van Acrobat Pro is niet nodig voor eenvoudige tabellen, maar het is de moeite waard om te weten dat de optie bestaat voor tabellen die browsergebaseerde tools verminken.
Kopiëren en plakken voor kleine, eenvoudige tabellen
Voor een kleine tabel (tien rijen, drie kolommen) kan het handmatig kopiëren en plakken van de PDF naar Excel sneller zijn dan het configureren en oplossen van problemen met een conversietool. Selecteer de tabeltekst in de PDF-viewer, kopieer en plak deze in Excel en gebruik vervolgens Gegevens > Tekst naar kolommen om de geplakte inhoud indien nodig in afzonderlijke kolommen te splitsen.
De aanpak van kopiëren en plakken mislukt snel bij grotere tabellen of tabellen met een complexe structuur. Voor alles boven de 50 rijen overschrijdt de tijd die wordt bespaard door een goede conversietool (zelfs met wat handmatig opschonen achteraf) de tijd die wordt besteed aan kopiëren en plakken en het corrigeren van fouten.
Probeer PDF naar Excel
Geen installatie nodig. Werkt rechtstreeks in uw browser.
