Konwersja obrazu do pliku PDF z możliwością wyszukiwania to proces dwuetapowy: najpierw obraz staje się plikiem PDF, a następnie OCR dodaje warstwę tekstową, aby można było przeszukiwać i wybierać zawartość. Obydwa kroki można wykonać łącznie w narzędziach, które je obsługują, lub osobno, jeśli wolisz większą kontrolę nad każdym etapem.

Różnica między zwykłym obrazem PDF a obrazem, który można przeszukiwać
Konwertując obraz do formatu PDF bez OCR, otrzymujesz plik PDF, który wyświetla obraz — możesz go otworzyć, powiększyć, wydrukować — ale nie możesz zaznaczać tekstu, wyszukiwać słów ani kopiować zawartości. Zasadniczo jest to zdjęcie zapakowane w pojemnik PDF. Przeszukiwalny plik PDF dodaje ukrytą warstwę tekstową pod obrazem, utworzoną przez OCR odczytujący tekst z obrazu. Wygląd nie uległ zmianie, ale teraz Ctrl+F wyszukuje słowa i tekst, który można skopiować.
Wypróbuj PDF OCR
Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.
Wykonywanie obu kroków na raz
Narzędzie OCR PDF firmy WukongPDF akceptuje obrazy bezpośrednio — a nie tylko istniejące pliki PDF. Prześlij plik JPG, PNG lub TIFF, a narzędzie przekonwertuje go na format PDF i uruchomi OCR w jednym kroku, zwracając plik PDF z możliwością przeszukiwania. Jest to najskuteczniejsza ścieżka w przypadku rozpoczynania od pliku obrazu, a nie istniejącego pliku PDF.
Dysk Google również obsługuje to w jednym kroku: prześlij obraz na Dysk, kliknij go prawym przyciskiem myszy i wybierz Otwórz w → Dokumentach Google. Napęd konwertuje obraz i automatycznie uruchamia OCR. Rezultatem jest edytowalny dokument Dokumentów Google, a nie plik PDF z możliwością przeszukiwania, ale w razie potrzeby możesz go stamtąd pobrać w formacie PDF.
Jakość obrazu decyduje o dokładności rozpoznawania OCR
OCR odczytuje piksele — jakość obrazu wejściowego bezpośrednio określa dokładność rozpoznawania tekstu. Ostra fotografia drukowanego dokumentu o wysokim kontraście i rozdzielczości 200 DPI lub wyższej zazwyczaj jest konwertowana z bardzo dużą dokładnością. Rozmyte zdjęcie telefonem zrobione pod kątem w słabym oświetleniu będzie obarczone wieloma błędami, niezależnie od tego, jakiego silnika OCR użyjesz.
Jeśli fotografujesz dokument fizyczny w celu utworzenia pliku PDF z możliwością przeszukiwania, kilka rzeczy znacznie poprawia wyniki: płaskie, równomierne oświetlenie bez cieni na całej stronie; aparat umieszczony bezpośrednio nad dokumentem, a nie pod kątem; i dokument leżący płasko, a nie zakrzywiony. Aplikacje do skanowania telefonów, takie jak Microsoft Lens i Adobe Scan, przed rozpoznawaniem OCR stosują automatyczną korekcję perspektywy i wzmocnienie kontrastu, dlatego często dają lepsze wyniki niż standardowe zdjęcie z aparatu.
Sprawdzanie wyników
Po konwersji sprawdź, czy OCR zadziałało, otwierając plik PDF i próbując Ctrl+F ze słowem, które widzisz w dokumencie. Jeśli zostanie znaleziony, warstwa tekstowa działa. Spróbuj wybrać fragment i skopiować go — wklej do edytora tekstu, aby upewnić się, że znaki są prawidłowe, a nie zniekształcone. W przypadku dokumentów, które będą archiwizowane lub na których opierać się będzie wyszukiwanie, warto poświęcić kilka minut na wyrywkowe sprawdzenie kilku stron pod kątem dokładności OCR.
PDF Kompresja po OCR może również pomóc w zmniejszeniu rozmiaru pliku — połączenie obrazu w pełnej rozdzielczości i osadzonej warstwy tekstowej może spowodować utworzenie plików większych niż oczekiwano, szczególnie w przypadku skanów obrazów wielostronicowych.
Wypróbuj PDF OCR
Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.
