Sì, ma richiede un passaggio aggiuntivo rispetto alla conversione di un PDF creato digitalmente. Un PDF scansionato è un'immagine, non un documento con dati strutturati, quindi il processo di conversione deve prima riconoscere il testo e i numeri nell'immagine prima di poterli inserire nelle celle del foglio di calcolo. Quando funziona bene, il risparmio di tempo è significativo. Quando ciò non avviene, è necessaria la pulizia.

Perché i PDF scansionati sono diversi
Un PDF creato digitalmente memorizza i dati come caratteri reali, ovvero numeri che possono essere letti direttamente e inseriti nelle celle. Un PDF scansionato memorizza le pagine come fotografie. I "numeri" in una tabella scansionata ci sono pixel che sembrano cifre. Per estrarli in Excel, il software deve esaminare quei pixel, determinare quali caratteri rappresentano e quindi capire la struttura della tabella: quali pixel formano righe, quali colonne e dove si trovano i confini delle celle.
Questo processo, il riconoscimento ottico dei caratteri combinato con il rilevamento della struttura della tabella, è più complesso della semplice conversione da PDF a Excel e introduce maggiori possibilità di errori.
Prova PDF in Excel
Nessuna installazione necessaria. Funziona direttamente nel tuo browser.
Che cosa influenza la qualità della conversione
La qualità della scansione è il fattore più importante. Una scansione pulita e ad alto contrasto di una tabella chiaramente stampata a 200+ DPI si converte bene: l'OCR legge i caratteri in modo accurato e la struttura della tabella è riconoscibile. Una scansione a bassa risoluzione, un documento sbiadito, una pagina inclinata o numeri scritti a mano in qualsiasi cella producono risultati significativamente peggiori.
Anche la complessità della struttura della tabella è importante. Una griglia semplice con bordi chiari e altezze di riga coerenti consente di eseguire conversioni in modo più affidabile rispetto a una tabella complessa con celle unite, intestazioni estese, sottotabelle nidificate o righe di altezza variabile. Una struttura più semplice significa meno decisioni che il software di conversione deve prendere e meno possibilità che tali decisioni siano sbagliate.
Come farlo
Lo strumento PDF in Excel di WukongPDF gestisce direttamente i PDF scansionati: il passaggio OCR viene eseguito automaticamente come parte della conversione. Carica il PDF scansionato, seleziona Excel come formato di output e scarica. Per scansioni pulite di tabelle ben strutturate, l'output è spesso utilizzabile con una pulizia minima. Apri il file Excel, rivedi i dati, correggi eventuali errori OCR (caratteri letti erroneamente, celle unite o divise) e il foglio di calcolo è pronto per l'uso.
Adobe Acrobat Pro offre una conversione particolarmente potente da PDF a Excel, con un migliore rilevamento delle tabelle rispetto alla maggior parte degli strumenti gratuiti. Se hai accesso ad esso e il documento è complesso, vale la pena utilizzarlo per la conversione iniziale anche se esegui la pulizia altrove.
Cosa controllare dopo la conversione
Non fidarti mai di una conversione PDF scansionata senza revisione, soprattutto per i dati numerici. L'OCR confonde comunemente alcune coppie di caratteri: 0 e O, 1 e l, 5 e S, 8 e B. Una tabella finanziaria in cui alcuni zeri venivano letti come la lettera O avrà formule interrotte e totali errati. Controllare a campione le cifre chiave rispetto alla scansione originale prima di utilizzare i dati per qualcosa di importante.
Controlla l'allineamento delle colonne: la conversione a volte inserisce i dati nella colonna sbagliata quando la tabella originale aveva una spaziatura irregolare o celle unite. Confronta la struttura dell'output di Excel con la scansione originale pagina per pagina, non solo controllando i singoli valori.
Quando l'inserimento manuale è più veloce
Per tabelle molto brevi (meno di 20 righe) o tabelle con struttura complessa che converte in modo inadeguato, l'immissione manuale dei dati è talvolta più veloce della conversione più pulizia. Una tabella di 10 righe con 5 colonne richiede circa tre minuti per essere digitata; se la conversione produce un risultato che richiede una correzione significativa, hai impiegato più tempo di quello che impiegheresti con un inserimento diretto.
L'approccio di conversione è particolarmente vantaggioso per le tabelle lunghe: dozzine o centinaia di righe in cui l'inserimento manuale richiederebbe ore. Per questi, anche la conversione imperfetta con pulizia è quasi sempre più veloce che iniziare da zero.
Prova PDF in Excel
Nessuna installazione necessaria. Funziona direttamente nel tuo browser.
