Others

Czy możesz OCR PDF na Dysku Google?

Dysk Google zawiera wbudowaną funkcję OCR, która uruchamia się automatycznie po otwarciu zeskanowanego pliku PDF w Dokumentach Google. Jest bezpłatny, nie wymaga dodatkowego oprogramowania i działa wystarczająco dobrze w przypadku większości popularnych dokumentów. Istnieją ograniczenia, o których warto wiedzieć, ale w przypadku prostego zeskanowanego tekstu radzi sobie niezawodnie.

Can You OCR a PDF in Google Drive?

Jak to zrobić

Prześlij zeskanowany plik PDF na Dysk Google. Po przesłaniu kliknij plik prawym przyciskiem myszy i wybierz Otwórz w → Dokumentach Google. Dysk automatycznie uruchamia OCR podczas konwersji i otwiera wynik jako edytowalny dokument Dokumentów Google. Oryginalny plik PDF pozostaje na Dysku niezmieniony – Google tworzy obok niego nowy plik Dokumentów.

Przekonwertowany dokument zawiera rozpoznany tekst w górnej części, a poniżej znajduje się obraz każdej strony oryginału. To dwuwarstwowe podejście pozwala zobaczyć, co rozpoznał Google, w porównaniu z tym, co faktycznie jest napisane na oryginalnej stronie – jest to przydatne do wychwytywania błędów OCR poprzez porównanie obu stron obok siebie.

WukongPDF

Wypróbuj PDF OCR

Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.

Zacznij teraz →

Co robi dobrze

W przypadku czystych skanów o wysokim kontraście standardowego drukowanego tekstu w popularnych językach funkcja OCR Dysku Google jest dokładna. Profesjonalnie wydrukowany dokument zeskanowany w rozdzielczości 200 DPI lub wyższej, zazwyczaj jest konwertowany z niewielką liczbą błędów. Obsługuje wiele języków i często rozpoznaje dokumenty wielojęzyczne bez żadnej specjalnej konfiguracji.

Wynik można natychmiast edytować w Dokumentach Google, co jest wygodne, jeśli chcesz wprowadzić zmiany w tekście. Z Dokumentów możesz także eksportować z powrotem do PDF (Plik → Pobierz → PDF Dokument) lub do formatu Word, jeśli zajdzie taka potrzeba.

Gdzie brakuje

Funkcja OCR Dysku Google nie zachowuje oryginalnego układu dokumentu. Tabele pojawiają się w postaci zwykłego tekstu, formatowanie wielokolumnowe ulega linearyzacji, a wszelkie złożone formatowanie zostaje utracone. Rozpoznawany tekst to zwykłe akapity — wizualnie niczym nie przypominające dokumentu źródłowego.

W przypadku dokumentów, w przypadku których konieczne jest zachowanie układu — formularza, który należy ponownie rozpowszechniać lub raportu, który powinien zachować swój oryginalny wygląd — funkcja OCR na Dysku Google udostępnia treść tekstową, ale konieczne jest ręczne ponowne zastosowanie formatowania. W przypadku dokumentów, w których do wyszukiwania, edytowania lub wyodrębniania danych potrzebna jest jedynie treść tekstowa, brak formatowania nie ma znaczenia.

Skany o niskiej jakości, wyblakły tekst, charakter pisma i nietypowe czcionki powodują zauważalnie więcej błędów. Znaki CJK (chiński, japoński, koreański) ogólnie poprawiły się w silniku OCR Google, ale nadal pozostają w tyle za dokładnością pisma łacińskiego w przypadku złożonego tekstu.

Kiedy dedykowane narzędzie OCR jest lepsze

Jeśli potrzebujesz danych wyjściowych OCR zapisanych w formacie PDF — pliku PDF z możliwością przeszukiwania, a nie Dokumentu Google — Dysk Google nie jest właściwym narzędziem. Konwertuje na plik Dokumentów, a nie z powrotem na plik PDF z warstwą tekstową. W tym celu narzędzie OCR PDF firmy WukongPDF przetwarza skan i zwraca plik PDF, w którym można zaznaczyć i przeszukać tekst, zachowując jednocześnie wygląd oryginalnego dokumentu. Zwykle ludzie to mają na myśli, mówiąc, że chcą „OCR w formacie PDF” — chcą z powrotem tego samego dokumentu, tylko z rozpoznawalnym tekstem, a nie obrazem.

W przypadku masowego rozpoznawania OCR wielu dokumentów lub dokumentów, w których liczy się dokładność w przypadku trudnych treści, dedykowane oprogramowanie OCR, takie jak ABBYY FineReader, zapewnia lepsze wyniki niż Dysk Google, kosztem bycia produktem płatnym. Do codziennego bezpłatnego OCR czystych zeskanowanych dokumentów Dysk Google radzi sobie z tym na tyle dobrze, że większość ludzi nie potrzebuje niczego więcej.

WukongPDF

Wypróbuj PDF OCR

Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.

Zacznij teraz →