Puoi convertire un'immagine in un PDF ricercabile?

La conversione di un'immagine in un PDF ricercabile è un processo in due fasi: prima l'immagine diventa un PDF, quindi l'OCR aggiunge un livello di testo in modo che il contenuto possa essere cercato e selezionato. Entrambi i passaggi possono essere eseguiti insieme negli strumenti che lo supportano o separatamente se preferisci un maggiore controllo su ciascuna fase.

Can You Convert an Image to a Searchable PDF?

La differenza tra un'immagine normale PDF e un'immagine ricercabile

Quando converti un'immagine in PDF senza OCR, ottieni un PDF che visualizza l'immagine: puoi aprirla, ingrandirla, stamparla, ma non puoi selezionare testo, cercare parole o copiare contenuto. È essenzialmente una foto avvolta in un contenitore PDF. Un PDF ricercabile aggiunge un livello di testo nascosto sotto l'immagine, creato dall'OCR leggendo il testo nell'immagine. L'aspetto visivo è invariato, ma ora Ctrl+F trova le parole e il testo può essere copiato.

Prova PDF OCR

Nessuna installazione necessaria. Funziona direttamente nel tuo browser.

Inizia ora →

Eseguire entrambi i passaggi contemporaneamente

Lo strumento OCR PDF di WukongPDF accetta direttamente le immagini, non solo i PDF esistenti. Carica un file JPG, PNG o TIFF e lo strumento lo converte in PDF ed esegue l'OCR in un solo passaggio, restituendo un PDF ricercabile. Questo è il percorso più efficiente quando si inizia da un file immagine anziché da un PDF esistente.

Anche Google Drive gestisce questo in un solo passaggio: carica l'immagine su Drive, fai clic con il pulsante destro del mouse e scegli Apri con → Google Documenti. Drive converte l'immagine ed esegue automaticamente l'OCR. Il risultato è un documento Google Docs modificabile anziché un PDF ricercabile, ma puoi scaricarlo come PDF da lì, se necessario.

La qualità dell'immagine determina la precisione dell'OCR

L'OCR legge i pixel: la qualità dell'immagine in ingresso determina direttamente la precisione con cui il testo viene riconosciuto. Una fotografia nitida e ad alto contrasto di un documento stampato a 200 DPI o superiore viene generalmente convertita con una precisione molto elevata. Una foto sfocata scattata con il telefono ad angolo in condizioni di scarsa illuminazione presenterà molti errori indipendentemente dal motore OCR utilizzato.

Se stai fotografando un documento fisico per creare un PDF ricercabile, alcune cose migliorano significativamente i risultati: illuminazione piatta e uniforme senza ombre sulla pagina; la fotocamera direttamente sopra il documento anziché inclinata; e il documento giace piatto anziché curvo. Le app di scansione del telefono come Microsoft Lens e Adobe Scan applicano la correzione automatica della prospettiva e il miglioramento del contrasto prima dell'OCR, motivo per cui spesso producono risultati migliori rispetto a una foto standard con fotocamera.

Verifica dell'output

Dopo la conversione, verifica che l'OCR abbia funzionato aprendo PDF e provando Ctrl+F con una parola che puoi vedere nel documento. Se viene trovato, il livello di testo è funzionante. Prova a selezionare un passaggio e a copiarlo: incollalo in un editor di testo per verificare che i caratteri siano corretti anziché confusi. Per i documenti che verranno archiviati o su cui si farà affidamento per la ricerca, il controllo a campione di alcune pagine per verificarne l'accuratezza OCR vale i pochi minuti necessari.

Un passaggio PDF Compressione dopo l'OCR può anche aiutare a ridurre le dimensioni del file: la combinazione di un'immagine a piena risoluzione e un livello di testo incorporato può produrre file più grandi del previsto, in particolare per scansioni di immagini di più pagine.

Prova PDF OCR

Nessuna installazione necessaria. Funziona direttamente nel tuo browser.

Inizia ora →