Google Drive verfügt über integrierte OCR, die automatisch ausgeführt wird, wenn Sie ein gescanntes PDF mit Google Docs öffnen. Es ist kostenlos, erfordert keine zusätzliche Software und funktioniert gut genug für die meisten gängigen Dokumente. Es gibt zwar wissenswerte Einschränkungen, aber bei einfachen gescannten Texten erledigt es die Aufgabe zuverlässig.

Wie es geht
Laden Sie das gescannte PDF auf Google Drive hoch. Klicken Sie nach dem Hochladen mit der rechten Maustaste auf die Datei und wählen Sie Öffnen mit → Google Docs. Drive führt während der Konvertierung automatisch OCR aus und öffnet das Ergebnis als bearbeitbares Google Docs-Dokument. Das ursprüngliche PDF bleibt in Drive unverändert – Google erstellt daneben eine neue Docs-Datei.
Das konvertierte Dokument enthält im oberen Teil den erkannten Text, gefolgt von einem Bild jeder Originalseite unten. Mit diesem zweischichtigen Ansatz können Sie sehen, was Google erkannt hat und was auf der Originalseite tatsächlich steht – nützlich, um OCR-Fehler zu erkennen, indem Sie die beiden nebeneinander vergleichen.
Probieren Sie PDF OCR aus
Keine Installation erforderlich. Funktioniert direkt in Ihrem Browser.
Was es gut macht
Für saubere, kontrastreiche Scans von gedrucktem Standardtext in gängigen Sprachen ist die OCR von Google Drive genau. Ein professionell gedrucktes Dokument, das mit 200 DPI oder höher gescannt wurde, wird normalerweise mit sehr wenigen Fehlern konvertiert. Es verarbeitet mehrere Sprachen und kann häufig Dokumente mit mehreren Sprachen ohne besondere Konfiguration erkennen.
Die Ausgabe kann sofort in Google Docs bearbeitet werden, was praktisch ist, wenn Sie Änderungen am Text vornehmen müssen. Von Docs aus können Sie bei Bedarf auch zurück in das PDF-Format (Datei → Herunterladen → PDF-Dokument) oder in das Word-Format exportieren.
Wo es zu kurz kommt
Die OCR von Google Drive behält das ursprüngliche Dokumentlayout nicht bei. Tabellen werden als einfacher Text angezeigt, mehrspaltige Formatierungen werden linearisiert und komplexe Formatierungen gehen verloren. Der erkannte Text besteht aus einfachen Absätzen – optisch hat er nichts mit dem Quelldokument zu tun.
Für Dokumente, bei denen das Layout erhalten bleiben soll – ein Formular, das Sie weitergeben möchten, ein Bericht, der sein ursprüngliches Design behalten soll – liefert Ihnen Google Drive OCR den Textinhalt, Sie müssten die Formatierung jedoch manuell erneut anwenden. Bei Dokumenten, in denen Sie lediglich den Textinhalt zum Suchen, Bearbeiten oder Extrahieren von Daten benötigen, spielt die fehlende Formatierung keine Rolle.
Scans von geringer Qualität, verblasster Text, Handschrift und ungewöhnliche Schriftarten führen zu deutlich mehr Fehlern. CJK-Zeichen (Chinesisch, Japanisch, Koreanisch) wurden in der OCR-Engine von Google im Allgemeinen verbessert, liegen aber bei komplexen Texten immer noch hinter der Genauigkeit lateinischer Schrift zurück.
Wenn ein spezielles OCR-Tool besser ist
Wenn Sie eine OCR-Ausgabe im PDF-Format benötigen – ein durchsuchbares PDF anstelle eines Google-Dokuments – ist Google Drive nicht das richtige Tool. Es wird in eine Docs-Datei konvertiert, nicht zurück in ein PDF mit einer Textebene. Zu diesem Zweck verarbeitet das Tool OCR PDF von WukongPDF den Scan und gibt ein PDF zurück, in dem der Text auswählbar und durchsuchbar ist, während das visuelle Erscheinungsbild des Originaldokuments erhalten bleibt. Dies ist im Allgemeinen das, was Menschen meinen, wenn sie sagen, dass sie eine „OCR-Datei in einem PDF“ erstellen möchten. – Sie wollen dasselbe Dokument zurück, nur mit erkennbarem Text und nicht mit einem Bild.
Für die Massen-OCR vieler Dokumente oder für Dokumente, bei denen es auf die Genauigkeit schwieriger Inhalte ankommt, liefert spezielle OCR-Software wie ABBYY FineReader bessere Ergebnisse als Google Drive, allerdings auf Kosten eines kostenpflichtigen Produkts. Für die tägliche kostenlose OCR von sauber gescannten Dokumenten ist Google Drive so gut in der Lage, dass die meisten Menschen nichts anderes benötigen.
Probieren Sie PDF OCR aus
Keine Installation erforderlich. Funktioniert direkt in Ihrem Browser.
