Google Drive include l'OCR integrato che viene eseguito automaticamente quando apri un PDF scansionato con Google Documenti. È gratuito, non richiede software aggiuntivo e funziona abbastanza bene per la maggior parte dei documenti comuni. Esistono limitazioni che vale la pena conoscere, ma per il semplice testo scansionato gestisce il lavoro in modo affidabile.

Come farlo
Carica il PDF scansionato su Google Drive. Una volta caricato, fai clic con il pulsante destro del mouse sul file e scegli Apri con → Google Documenti. Drive esegue automaticamente l'OCR durante la conversione e apre il risultato come documento Google Docs modificabile. Il PDF originale rimane in Drive invariato: Google crea un nuovo file di documenti accanto ad esso.
Il documento convertito contiene il testo riconosciuto nella parte superiore, seguito da un'immagine di ciascuna pagina originale in basso. Questo approccio a doppio livello ti consente di vedere ciò che Google ha riconosciuto rispetto a ciò che effettivamente dice la pagina originale, utile per individuare gli errori OCR confrontando i due fianco a fianco.
Prova PDF OCR
Nessuna installazione necessaria. Funziona direttamente nel tuo browser.
Che cosa fa bene
Per scansioni pulite e ad alto contrasto di testo stampato standard nelle lingue comuni, l'OCR di Google Drive è accurato. Un documento stampato professionalmente e scansionato a 200 DPI o superiore in genere viene convertito con pochissimi errori. Gestisce più lingue e spesso può riconoscere documenti in lingue miste senza alcuna configurazione speciale.
L'output è immediatamente modificabile in Google Docs, il che è comodo se è necessario apportare modifiche al testo. Da Documenti puoi anche esportare nuovamente in PDF (File → Scarica → Documento PDF) o in formato Word, se necessario a valle.
Dove manca
L'OCR di Google Drive non preserva il layout del documento originale. Le tabelle vengono visualizzate come testo semplice, la formattazione su più colonne viene linearizzata e qualsiasi formattazione complessa viene persa. Il testo riconosciuto è costituito da semplici paragrafi: visivamente, non ha niente a che vedere con il documento di origine.
Per i documenti in cui è necessario conservare il layout (un modulo da ridistribuire, un report che dovrebbe mantenere il suo design originale) Google Drive OCR ti fornisce il contenuto del testo ma dovresti riapplicare manualmente la formattazione. Per i documenti in cui è necessario solo il contenuto testuale per cercare, modificare o estrarre dati, la mancanza di formattazione non ha importanza.
Scansioni di bassa qualità, testo sbiadito, scrittura a mano e caratteri insoliti producono un numero notevolmente maggiore di errori. I caratteri CJK (cinese, giapponese, coreano) sono generalmente migliorati nel motore OCR di Google, ma sono ancora indietro rispetto alla precisione della scrittura latina per i testi complessi.
Quando uno strumento OCR dedicato è migliore
Se hai bisogno di un output OCR che rimanga nel formato PDF (un PDF ricercabile anziché un documento Google), Google Drive non è lo strumento giusto. Si converte in un file Documenti, non in un PDF con un livello di testo. Per questo, lo strumento OCR PDF di WukongPDF elabora la scansione e restituisce un PDF in cui il testo è selezionabile e ricercabile mentre l'aspetto visivo del documento originale viene preservato. Questo è generalmente ciò che le persone intendono quando dicono di voler eseguire l'OCR di un PDF" - vogliono indietro lo stesso documento, solo con un testo riconoscibile anziché un'immagine.
Per l'OCR in blocco di molti documenti o per documenti in cui la precisione su contenuti difficili è importante, un software OCR dedicato come ABBYY FineReader produce risultati migliori di Google Drive, al costo di essere un prodotto a pagamento. Per l'OCR gratuito quotidiano di documenti scansionati puliti, Google Drive lo gestisce abbastanza bene che la maggior parte delle persone non ha bisogno di nient'altro.
Prova PDF OCR
Nessuna installazione necessaria. Funziona direttamente nel tuo browser.
