Others

Problem z plikami PDF opartymi na zrzutach ekranu

Zrobienie zrzutu ekranu i zapisanie go w formacie PDF wydaje się szybkim sposobem na uchwycenie czegoś. W przypadku pojedynczego obrazu działa dobrze. Jako proces tworzenia dokumentów — zrzutów ekranu arkuszy kalkulacyjnych, zrzutów ekranu stron internetowych, zrzutów ekranu innych plików PDF — tworzy pliki z poważnymi praktycznymi ograniczeniami, które nie są oczywiste, dopóki nie spróbujesz zrobić z nimi czegoś pożytecznego. Oto, co idzie nie tak i co zamiast tego zrobić.

The Problem With Screenshot-Based PDFs

Co zawiera zrzut ekranu PDF Właściwie

Plik PDF utworzony ze zrzutów ekranu to kontener zawierający jeden lub więcej obrazów. Nie ma warstwy tekstowej, żadnej struktury dokumentu, żadnych metadanych na temat znaczenia treści. Słowa widoczne na zrzucie ekranu istnieją jedynie w postaci pikseli — kolorowych kropek ułożonych tak, aby wyglądały jak litery. Dokument nie ma większej treści semantycznej niż fotografia strony.

To rozróżnienie — prawdziwy tekst i piksele wyglądające jak tekst — jest podstawową przyczyną każdego następującego problemu. Problem z jakością PDF na zrzucie ekranu PDF nie jest awarią formatu PDF; jest to podstawowe ograniczenie używania formatu obrazu tam, gdzie potrzebny jest format dokumentu.

WukongPDF

Wypróbuj PDF OCR

Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.

Zacznij teraz →

Nie możesz tego przeszukać

Naciśnij Ctrl+F na zrzucie ekranu PDF, a wyszukiwanie nic nie znajdzie. Tekst widoczny na stronie nie istnieje jako treść, którą można przeszukiwać. Jeśli tworzysz plik PDF artykułu badawczego, tabeli danych lub dowolnego dokumentu, do którego będziesz musiał odwołać się później, brak możliwości wyszukiwania w nim stanowi znaczące praktyczne ograniczenie.

Plik nie będzie także pojawiał się w wynikach wyszukiwania w systemie operacyjnym według zawartości — tylko według nazwy pliku. Po folderze zrzutów ekranu PDFs można nawigować tylko w zakresie zgodnym z konwencją nazewnictwa, bez możliwości wyszukiwania słów, które pamiętasz z dokumentu.

Jakość ulega pogorszeniu — i nie można jej odzyskać

Zrzut ekranu rejestruje zawartość w rozdzielczości ekranu — zazwyczaj od 72 do 96 DPI na standardowym monitorze. PDF dokumenty przeznaczone do odczytu lub wydruku powinny mieć rozdzielczość co najmniej 150 DPI; wszystko, co zostanie wydrukowane w wysokiej jakości, wymaga rozdzielczości 300 DPI. Zrzut ekranu PDF jest poniżej minimalnego progu niezawodnej jakości druku, a problem pogłębia się, jeśli PDF zostanie następnie skompresowany.

Tekst, który wygląda akceptowalnie na ekranie przy powiększeniu 100%, często po wydrukowaniu lub powiększeniu wygląda na zauważalnie pikselowany. Liczby w tabelach — szczególnie ważne dla dokładnego ich odczytania — mogą stać się niejednoznaczne przy niskiej rozdzielczości. „6” i „8” które można rozróżnić w oryginalnej rozdzielczości, mogą wyglądać identycznie na skompresowanym zrzucie ekranu PDF.

Nie możesz skopiować z niego tekstu

Wybranie i skopiowanie ryciny, cytatu, klauzuli lub innej treści ze zrzutu ekranu PDF jest niemożliwe bez OCR. Kursor tekstowy albo się nie pojawi, albo zaznaczy cały obraz jako blok. Każdy, kto otrzyma dokument i będzie chciał wydobyć z niego jakąkolwiek treść – wkleić cytat do raportu, skopiować rysunek do arkusza kalkulacyjnego – staje przed koniecznością ręcznego przepisywania.

W przypadku dokumentów, które tworzysz dla innych osób – tabel danych, dokumentów referencyjnych, podsumowań badań – to ograniczenie znacznie zmniejsza użyteczność dokumentu. PDF z prawdziwym tekstem umożliwia współpracę; zrzut ekranu PDF jest tylko do odczytu w najbardziej dosłownym tego słowa znaczeniu.

Nie spełnia wymagań dostępności

Czytniki ekranu — oprogramowanie używane przez osoby z wadami wzroku — działają poprzez odczytywanie zawartości tekstowej dokumentu. Zrzut ekranu PDF nie zawiera treści tekstowej. Czytnik ekranu informuje, że dokument jest otwarty, a następnie nie ma nic do przeczytania. W kontekście zawodowym lub publicznym, gdzie dokumenty muszą spełniać standardy dostępności, zrzut ekranu PDF nie spełnia wszystkich mających zastosowanie wymagań. Nie jest to błahy problem — w wielu jurysdykcjach rozpowszechnianie niedostępnych dokumentów, gdy dostępne są alternatywne rozwiązania, stanowi problem związany z przestrzeganiem przepisów.

Co zrobić zamiast robić zrzuty ekranu

Właściwe podejście zależy od tego, co chcesz uchwycić:

  • Przechwytywanie strony internetowej: użyj wbudowanego w przeglądarkę przycisku Drukuj > Zapisz jako funkcję PDF lub użyj najpierw trybu czytnika, aby uzyskać czystszy wydruk. Wynik zawiera prawdziwy tekst, a nie piksele.
  • Przechwytywanie arkusza kalkulacyjnego: eksportuj bezpośrednio z programu Excel lub Arkuszy Google za pomocą opcji Plik > Pobierz > PDF. Rezultatem jest prawidłowo sformatowany plik PDF z prawdziwym tekstem we właściwej rozdzielczości.
  • Przechwytywanie kolejnego PDF: wyodrębnij potrzebne strony, korzystając z narzędzia podziału, zamiast robić zrzuty ekranu. Wyodrębnione strony zachowują oryginalną rozdzielczość i warstwę tekstową.
  • Masz już zrzuty ekranu PDF w swoim archiwum: uruchom je za pomocą narzędzia OCR PDF firmy WukongPDF pod adresem www.wukongpdf.com, aby dodać warstwę tekstową z możliwością przeszukiwania. Nie przywróci rozdzielczości o jakości druku, ale umożliwi przeszukiwanie i kopiowanie treści.

Zrzuty ekranu mają swoje miejsce — ale nie jako dokumenty

Zrzuty ekranu są przydatne do przechwytywania stanu wizualnego — wyglądu ekranu w danym momencie, błędu interfejsu użytkownika, odniesienia do projektu. To niewłaściwe narzędzie do tworzenia zapisów dokumentów, materiałów referencyjnych lub czegokolwiek, co należy przeszukiwać, kopiować, drukować w dobrej jakości lub uzyskać do nich dostęp osoby korzystające z technologii wspomagających. W przypadku czegokolwiek w tych kategoriach użyj funkcji eksportu aplikacji źródłowej, a nie skrótu do zrzutu ekranu.

WukongPDF

Wypróbuj PDF OCR

Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.

Zacznij teraz →