Others

Pouvez-vous OCR un PDF dans Google Drive ?

Google Drive inclut une OCR intégrée qui s'exécute automatiquement lorsque vous ouvrez un PDF numérisé avec Google Docs. C'est gratuit, ne nécessite aucun logiciel supplémentaire et fonctionne assez bien pour la plupart des documents courants. Il existe des limitations qu'il convient de connaître, mais pour le texte numérisé simple, il gère le travail de manière fiable.

Can You OCR a PDF in Google Drive?

Comment faire

Téléchargez le PDF numérisé sur Google Drive. Une fois téléchargé, cliquez avec le bouton droit sur le fichier et choisissez Ouvrir avec → Google Docs. Drive exécute automatiquement l'OCR pendant la conversion et ouvre le résultat sous forme de document Google Docs modifiable. Le PDF d'origine reste inchangé dans Drive : Google crée un nouveau fichier Docs à côté de lui.

Le document converti contient le texte reconnu dans la partie supérieure, suivi d'une image de chaque page originale en dessous. Cette approche à double couche vous permet de voir ce que Google a reconnu par rapport à ce que dit réellement la page d'origine, ce qui est utile pour détecter les erreurs OCR en comparant les deux côte à côte.

WukongPDF

Essayez PDF OCR

Aucune installation nécessaire. Fonctionne directement dans votre navigateur.

Commencer →

Ce qu'il fait bien

Pour des numérisations nettes et contrastées de textes imprimés standard dans des langues courantes, l'OCR de Google Drive est précis. Un document imprimé professionnellement et numérisé à 200 DPI ou plus est généralement converti avec très peu d'erreurs. Il gère plusieurs langues et peut souvent reconnaître des documents multilingues sans aucune configuration particulière.

Le résultat est immédiatement modifiable dans Google Docs, ce qui est pratique si vous devez apporter des modifications au texte. À partir de Docs, vous pouvez également réexporter au format PDF (Fichier → Télécharger → Document PDF) ou au format Word si nécessaire en aval.

Là où cela échoue

L'OCR de Google Drive ne préserve pas la mise en page originale du document. Les tableaux apparaissent sous forme de texte brut, le formatage multi-colonnes est linéarisé et tout formatage complexe est perdu. Le texte reconnu est constitué de simples paragraphes – visuellement, rien à voir avec le document source.

Pour les documents dont la mise en page doit être préservée (un formulaire que vous redistribuerez, un rapport qui doit conserver sa conception d'origine), Google Drive OCR vous donne le contenu du texte, mais vous devrez réappliquer manuellement le formatage. Pour les documents dont vous avez juste besoin du contenu textuel pour rechercher, modifier ou extraire des données, le manque de formatage n'a pas d'importance.

Les numérisations de mauvaise qualité, le texte estompé, l'écriture manuscrite et les polices inhabituelles produisent nettement plus d'erreurs. Les caractères CJK (chinois, japonais, coréen) se sont généralement améliorés dans le moteur OCR de Google, mais restent en retard par rapport à la précision de l'écriture latine pour les textes complexes.

Quand un outil OCR dédié est meilleur

Si vous avez besoin d'une sortie OCR qui reste au format PDF (un PDF consultable plutôt qu'un Google Doc), Google Drive n'est pas le bon outil. Il se convertit en fichier Docs, et non en PDF avec un calque de texte. Pour cela, l'outil OCR PDF de WukongPDF traite la numérisation et renvoie un PDF où le texte est sélectionnable et consultable tout en conservant l'apparence visuelle du document original. C'est généralement ce que les gens veulent dire lorsqu'ils disent qu'ils veulent « OCR un PDF » ; - ils veulent récupérer le même document, juste avec un texte reconnaissable plutôt qu'une image.

Pour l'OCR en masse de nombreux documents, ou pour les documents dont la précision sur un contenu difficile est important, un logiciel OCR dédié comme ABBYY FineReader produit de meilleurs résultats que Google Drive, au prix d'être un produit payant. Pour l'OCR gratuite quotidienne de documents numérisés propres, Google Drive le gère suffisamment bien pour que la plupart des gens n'aient besoin de rien d'autre.

WukongPDF

Essayez PDF OCR

Aucune installation nécessaire. Fonctionne directement dans votre navigateur.

Commencer →