Nadchodzi sezon podatkowy i musisz znaleźć paragon na sprzęt, który kupiłeś jedenaście miesięcy temu. Masz folder zeskanowanych plików PDF — sześćdziesiąt lub siedemdziesiąt z nich, wszystkie o nazwach typu „scan_20240318”; i „receipt_march” — i nie ma możliwości przeszukania ich wnętrza. Otwierasz pliki jeden po drugim, aż dwadzieścia minut później znajdziesz właściwy. Jest to problem do rozwiązania, a jego rozwiązanie zajmuje mniej czasu niż jedna sesja wyszukiwania złego sezonu podatkowego.

Dlaczego zeskanowane paragony są trudne do znalezienia
Zeskanowany paragon jest obrazem. Tekst widoczny na skanie – nazwa dostawcy, data, ilość, pozycje – istnieje tylko w postaci pikseli. Wyszukiwarka Twojego systemu operacyjnego nie może tego odczytać, Twoja przeglądarka PDF nie może tego przeszukać, a po wpisaniu nazwy dostawcy żadna kombinacja klawiszy Ctrl+F nie wyświetli rachunku za sprzęt.
Rozwiązaniem jest OCR — optyczne rozpoznawanie znaków. Uruchomienie Zeskanowanego pliku PDF za pomocą narzędzia OCR powoduje odczytanie obrazu, rozpoznanie znaków i osadzenie w pliku prawdziwego, możliwego do przeszukiwania tekstu. Po OCR paragon zawiera zarówno oryginalny obraz (więc nadal wygląda dokładnie tak samo), jak i ukrytą warstwę tekstową, którą mogą znaleźć narzędzia wyszukiwania. Szukasz "Zszywki” lub „Listopad” i natychmiast pojawiają się odpowiednie pliki.
Wypróbuj PDF OCR
Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.
Tworzenie działającego przepływu pracy związanego z paragonami
Najtrwalszym podejściem jest włączenie funkcji OCR do procesu już w momencie ich przechwycenia, dzięki czemu każdy paragon będzie można przeszukiwać od momentu jego zapisania, a nie będzie można go później przetwarzać z mocą wsteczną.
Aplikacje do skanowania telefonów z wbudowanym OCR obsługują to automatycznie. Adobe Scan, Microsoft Lens i podobne aplikacje fotografują paragony, stosują OCR i zapisują przeszukiwalny plik PDF w jednym kroku. Plik, który wyląduje w Twojej chmurze lub folderze pobierania, można już przeszukiwać. Nie wymaga dodatkowego przetwarzania.
W przypadku paragonów przechwyconych za pomocą skanera płaskiego lub podstawowej aplikacji skanera bez OCR, po zeskanowaniu przeprowadź każdy plik za pomocą narzędzia OCR PDF firmy WukongPDF pod adresem www.wukongpdf.com. Prześlij zeskanowany paragon, przetwórz go i pobierz wersję z możliwością wyszukiwania. Zamień oryginalny plik na plik przetworzony w OCR, a paragon będzie natychmiast widoczny według treści.
Nazywanie i porządkowanie, abyś mógł znaleźć rzeczy dwa lata później
OCR umożliwia wyszukiwanie paragonów według treści, ale spójna konwencja nazewnictwa sprawia, że można je znaleźć jeszcze szybciej, a sam folder jest czytelny na pierwszy rzut oka. Nazwa taka jak „2024-03-18_Staples_office-supplies_42.50.pdf” powie Ci wszystko o paragonie, zanim go otworzysz: datę, dostawcę, kategorię, kwotę.
Praktyczna struktura folderów dla archiwów paragonów:
- Najwyższy poziom: rok (2024, 2025)
- Poziom drugi: kategoria (Podróże, Biuro, Sprzęt, Posiłki, Oprogramowanie)
- Pliki: indywidualne paragony z podaniem daty, dostawcy i kwoty
Ta struktura oznacza, że możesz znaleźć „wszystkie rachunki za podróże z 2024 r.” otwierając jedną teczkę i „paragon Marriott z marca” wyszukując w tym folderze. Nazewnictwo oparte na dacie automatycznie sortuje wszystko chronologicznie.
Przetwarzanie zaległości niezbadanych wpływów
Jeśli masz już folder zawierający zeskanowane tylko obrazy paragonów, które należy umożliwić przeszukiwanie, najskuteczniejsza jest metoda wsadowa. Zamiast przetwarzać pojedynczo, zbierz je wszystkie i przepuszczaj partiami przez OCR.
W przypadku zaległości obejmujących dziesiątki plików poświęć godzinę na:
- Uruchom wszystkie pliki za pomocą narzędzia OCR, aby umożliwić ich przeszukiwanie
- Zmień nazwę każdego pliku na format data-sprzedawca-kwota
- Sortuj pliki według struktury folderów roku/kategorii
- Uruchom wyszukiwanie testowe, aby potwierdzić, że OCR zadziałał — wyszukaj nazwę dostawcy, o której wiesz, że znajduje się na jednym z rachunków
Jedna godzina przetwarzania zaległości eliminuje lata przyszłych frustracji związanych z poszukiwaniem. Po wdrożeniu systemu i prawidłowym przetwarzaniu nowych paragonów przy odbiorze archiwum samo się utrzymuje.
Różnica między archiwum paragonów a stosem paragonów
Folder zawierający wyłącznie zeskanowane obrazy PDF z nieprzydatnymi nazwami to stos paragonów — technicznie cyfrowy, ale praktycznie tak trudny do przeszukania jak papierowe pudełko po butach. Folder zawierający przetworzone za pomocą OCR rachunki o spójnych nazwach uporządkowane według roku i kategorii to archiwum — które można znaleźć, przeszukiwać i które jest przydatne, gdy naprawdę czegoś potrzebujesz. Różnica polega na konsekwentnie stosowanym przepływie pracy, począwszy od dzisiaj.
Wypróbuj PDF OCR
Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.
