Others

Dlaczego mój zeskanowany plik PDF jest tak duży?

Zeskanowany plik PDF pięciostronicowego listu nie powinien zajmować 80 MB. Często jednak tak się dzieje, a przyczyna prawie zawsze wynika z konfiguracji skanowania, a nie z samego dokumentu. Rozmiar pliku zeskanowanego pliku PDF nie ma nic wspólnego z ilością tekstu na stronie — zależy wyłącznie od danych obrazu przechwyconych przez skaner. Zrozumienie tego rozróżnienia wskazuje bezpośrednio na poprawkę.

Why Is My Scanned PDF So Large?

Ustawiono zbyt wysoką rozdzielczość skanera

Jest to najczęstsza przyczyna zeskanowanych plików PDF o dużych rozmiarach i dużym marginesie. Rozdzielczość skanera mierzona jest w DPI (punktach na cal). Im wyższa wartość DPI, tym więcej danych obrazu jest przechwytywanych i tym większy jest plik wynikowy. Wiele skanerów ma domyślnie ustawioną rozdzielczość 300 lub 600 DPI, która jest odpowiednia do archiwizowania dokumentów, które mogą być potrzebne do wydrukowania w dużym formacie lub z bliska. W przypadku standardowego dokumentu tekstowego, który udostępniasz e-mailem lub przesyłasz do portalu, jest to przesada.

Przy rozdzielczości 300 DPI pojedyncza strona A4 w kolorze generuje około 25 MB surowych danych obrazu przed jakąkolwiek kompresją. Pomnóż to przez 10-stronicowy dokument, a zaczniesz od 250 MB, zanim PDF w ogóle zostanie zapisany. Większość skanerów stosuje kompresję automatycznie, ale punktem wyjścia jest wciąż duża ilość danych.

W przypadku dokumentów tekstowych wystarczająca jest rozdzielczość 150 DPI, aby uzyskać czyste i czytelne wydruki. W przypadku dokumentów zawierających zdjęcia lub szczegółowe diagramy 200 DPI to rozsądny pułap do celów udostępniania. Zaoszczędź 300+ DPI na rzeczywiste potrzeby archiwizacyjne, w których może zaistnieć potrzeba późniejszego odtworzenia dokumentu w pełnej jakości.

WukongPDF

Spróbuj skompresować PDF

Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.

Zacznij teraz →

Skanowanie w kolorze zamiast w skali szarości lub w trybie czarno-białym

Skany kolorowe przechowują trzy kanały danych dla każdego piksela — wartości czerwonego, zielonego i niebieskiego. Skan w skali szarości przechowuje tylko jeden. Skan czarno-biały (bitonalny) przechowuje jeden bit na piksel — albo czarny, albo biały, nic pomiędzy. Różnica w rozmiarze pliku jest znacząca: kolorowy skan zwykłego dokumentu tekstowego może być 10–20 razy większy niż tego samego dokumentu skanowanego w trybie czarno-białym.

Jeśli dokument jest napisany czarnym tuszem na białym papierze — co opisuje większość dokumentów biznesowych, umów i formularzy — skanowanie w kolorze nie przynosi żadnych korzyści. Skan uchwyci lekko kremowy kolor papieru, szare cienie w pobliżu otworów na zszywki i subtelne różnice w gęstości atramentu, które nie są potrzebne. Przełączenie w ustawieniach skanera na tryb czarno-biały lub w skali szarości znacznie zmniejsza rozmiar pliku.

W momencie zapisywania nie zastosowano żadnej kompresji

Niektóre programy skanera zapisują zeskanowane obrazy z minimalną kompresją lub bez niej. Skaner przechwytuje surowe dane obrazu i zapisuje je w pliku PDF prawie w niezmienionej postaci, co skutkuje niepotrzebnie dużym plikiem w stosunku do jego zawartości. Zależy to od skanera i oprogramowania — niektóre domyślnie stosują agresywną kompresję, inne ledwo ją dotykają.

Jeśli masz już zeskanowany plik PDF o dużych rozmiarach, często najszybszym rozwiązaniem jest uruchomienie go za pomocą narzędzia PDF Compression. Dobre narzędzie do kompresji zastosowane do zeskanowanego pliku PDF może zmniejszyć rozmiar pliku o 60–80% bez widocznej zmiany jakości — szczególnie w przypadku czarno-białych dokumentów tekstowych, w których dane obrazu są kompresowane niezwykle wydajnie.

Skan zawiera niepotrzebne lub puste strony

Skanery z automatycznym podajnikiem dokumentów czasami przeciągają dodatkowe puste strony, zwłaszcza jeśli tylna strona dokumentu jest pusta. Każda pusta strona nadal jest zapisywana jako pełny obraz w pliku PDF, co zwiększa rozmiar pliku bez dodawania jakiejkolwiek przydatnej zawartości. Skan 20 stron z 6 przypadkowymi pustymi stronami jest o 30% większy niż powinien.

Po zeskanowaniu szybko przejrzyj PDF i usuń wszystkie puste lub zduplikowane strony przed zapisaniem lub udostępnieniem. Większość narzędzi PDF umożliwia usuwanie pojedynczych stron — zajmuje to około 30 sekund i może znacząco zmniejszyć ostateczny rozmiar.

Jak zmniejszyć rozmiar istniejącego zeskanowanego pliku PDF

Jeśli skanowanie zostało już wykonane, a plik jest za duży, masz dwie główne możliwości: skompresuj go lub przeskanuj ponownie z lepszymi ustawieniami. Ponowne skanowanie jest czystszym rozwiązaniem, jeśli nadal masz dostęp do dokumentu fizycznego i chcesz uzyskać najlepszy możliwy wynik. Jeśli jednak potrzebujesz szybko zmniejszyć rozmiar pliku, kompresja działa dobrze.

Narzędzie PDF firmy WukongPDF do kompresji dobrze radzi sobie ze zeskanowanymi plikami PDF, ponieważ bezpośrednio optymalizuje osadzone obrazy — z czego dokładnie składa się zeskanowany plik PDF. Prześlij plik, wybierz poziom kompresji i pobierz wynik. W przypadku typowego zeskanowanego dokumentu tekstowego wydruk jest zwykle o 70–85% mniejszy niż oryginał, bez widocznej utraty jakości.

Ustawienia skanowania do wykorzystania w przyszłości

Kilka zmian w ustawieniach skanera umożliwi zarządzanie plikami od samego początku:

  • Dokumenty tekstowe: tryb czarno-biały, 150 DPI
  • Dokumenty ze zdjęciami lub grafiką: w skali szarości lub w kolorze, 200 DPI
  • Archiwizacja oryginałów, których reprodukcja może być konieczna: 300 DPI, kolor, jeśli dotyczy
  • Zawsze włączaj kompresję PDF w oprogramowaniu skanera, jeśli opcja jest dostępna

Zeskanowane pliki PDF nie muszą być ogromne. Dzięki właściwym ustawieniom podczas skanowania pliki są małe bez utraty jakości, której naprawdę potrzebujesz — a kompresja po fakcie radzi sobie ze wszystkim, co się prześlizgnie.

WukongPDF

Spróbuj skompresować PDF

Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.

Zacznij teraz →