Tagowanie PDF jest strukturalnym szkieletem dostępnego pliku PDF. Otagowany plik PDF zawiera ukryte metadane opisujące, czym jest każdy element strony — który tekst jest nagłówkiem, a który akapitem, który obraz wymaga opisu, jaka jest struktura tabel i w jakiej kolejności należy czytać treść. Bez znaczników PDF jest po prostu układem wizualnym bez struktury czytelnej maszynowo.

Co to są tagi PDF
Tagi w pliku PDF działają podobnie do tagów HTML na stronie internetowej. Podobnie jak HTML używa <h1> dla nagłówków i <p> w przypadku akapitów znaczniki PDF oznaczają każdy element treści jego typem i rolą. Drzewo znaczników — struktura hierarchiczna osadzona w pliku PDF — opisuje logiczną organizację dokumentu:
- <H1>, <H2>, <H3>: elementy nagłówków na różnych poziomach, umożliwiające nawigację według nagłówków
- <P>: tekst akapitu, najpopularniejszy element treści
- <Rysunek>: obrazy i grafiki, które mogą zawierać alternatywne opisy tekstowe dla czytników ekranu
- <Table>, <TR>, <TD>: struktury tabel z wierszami i komórkami, umożliwiające czytnikom ekranu ogłaszanie nagłówków kolumn i wierszy
- <L>, <LI>: lista i elementy elementów listy, dzięki czemu czytniki ekranu ogłaszają „listę 5 elementów”; przed przeczytaniem każdego wpisu
Spróbuj edytować PDF
Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.
Dlaczego tagowanie ma znaczenie
Tagi sprawiają, że PDF jest dostępny dla osób korzystających z technologii wspomagających. Czytnik ekranu przetwarzający nieotagowany plik PDF nie ma możliwości odróżnienia nagłówka od tekstu podstawowego, nie jest w stanie określić, który tekst jest nagłówkiem komórki tabeli i nie wie, które obrazy należy opisać, a które mają charakter wyłącznie dekoracyjny. Czytanie staje się mylące lub niemożliwe.
Poza PDF Dostępność tagi przynoszą korzyści wszystkim. Tagi umożliwiają niezawodne ponowne rozmieszczenie tekstu na małych ekranach — oznaczony plik PDF umożliwia ponowne rozmieszczenie treści w celu dopasowania do wyświetlacza telefonu. Tagi zwiększają niezawodność kopiowania i wklejania, dostarczając informacji o kolejności czytania. Tagi umożliwiają lepsze indeksowanie wyszukiwania przez systemy zarządzania dokumentami. Znaczniki są wymagane w celu zapewnienia zgodności prawnej z normami dostępności, w tym sekcją 508 w USA i normą EN 301 549 w Europie.
Jak sprawdzić, czy PDF jest oznaczony tagiem
W programie Adobe Reader lub Acrobat kliknij opcję Plik > Właściwości > Zakładka Opis. Poszukaj tekstu „Otagowano PDF: Tak” lub „Otagowano PDF: Nie.” Szybki test funkcjonalności: włącz opcję Czytaj na głos (Widok > Czytaj na głos > Aktywuj Czytaj na głos) i słuchaj, jak dokument jest ogłaszany. Dobrze oznaczony PDF czyta się logicznie; nieoznaczony lub słabo oznaczony PDF albo w ogóle nie czyta, albo czyta treść w mylącej kolejności.
Narzędzie sprawdzania dostępności programu Acrobat Pro (Narzędzia > Dostępność > Pełna kontrola) udostępnia szczegółowy raport identyfikujący konkretne problemy ze znacznikami — brak tekstu alternatywnego w obrazach, nieprawidłową hierarchię nagłówków, tabele bez znaczników nagłówków i inne problemy wpływające na zgodność z PDF Dostępność.
Jak PDF są oznaczane
Najlepszym sposobem na uzyskanie oznaczonego pliku PDF jest wyeksportowanie z dokumentu źródłowego o dobrze zorganizowanej strukturze. Dokumenty programu Microsoft Word korzystające z odpowiednich stylów nagłówków, formatowania list i tabel o określonej strukturze są automatycznie eksportowane ze znacznikami podczas korzystania z opcji Plik > Zapisz jako > PDF. Struktura znaczników odzwierciedla hierarchię nagłówków dokumentu i organizację treści.
Dokumenty Google eksportują także oznaczone pliki PDF po pobraniu jako PDF. Program InDesign wymaga jawnych ustawień dostępności podczas eksportowania, aby wygenerować znaczniki. Kluczem we wszystkich przypadkach jest użycie struktury semantycznej — odpowiednich stylów nagłówków zamiast ręcznie pogrubionego tekstu, formatowania listy zamiast ręcznie wciętych wierszy — które silnik eksportu może zmapować na znaczniki PDF.
Dodawanie tagów do istniejącego nieoznaczonego pliku PDF
Acrobat Pro może automatycznie dodawać znaczniki do istniejącego nieoznaczonego pliku PDF: Narzędzia > Dostępność > Dodaj tagi do dokumentu. Funkcja automatycznego tagowania analizuje układ strony i próbuje wywnioskować poziomy nagłówków, akapitów i strukturę listy na podstawie formatowania wizualnego. W przypadku prostych dokumentów automatyczne tagowanie sprawdza się dobrze. W przypadku złożonych układów tworzy punkt wyjścia, który wymaga ręcznego przeglądu i korekty.
Ręczna edycja tagów w programie Acrobat Pro odbywa się za pośrednictwem panelu Tagi (Widok > Pokaż/Ukryj > Panele nawigacji > Tagi). Panel pokazuje pełne drzewo tagów i umożliwia dodawanie, usuwanie, przenoszenie i ponowne wpisywanie tagów. Jest to szczegółowa praca — dokładne naprawienie złożonego, nieoznaczonego pliku PDF może zająć wiele godzin — ale jest to jedyna droga do pełnej zgodności z dostępnością, gdy dokument źródłowy nie jest dostępny.
Kiedy wymagane jest tagowanie
Agencje rządowe, organizacje sektora publicznego, instytucje edukacyjne i wszelkie organizacje otrzymujące fundusze federalne w USA są zazwyczaj zobowiązane do tworzenia dostępnych plików PDF zgodnie z sekcją 508. Dokumenty prawne składane elektronicznie w sądach, które wymagają zgodności z przepisami dotyczącymi dostępności, muszą być oznaczone. Organizacje korporacyjne coraz częściej wymagają dostępnych plików PDF z dokumentami HR, politykami i publikacjami zewnętrznymi w ramach szerszych zobowiązań PDF i ESG. Jeśli Twoja organizacja rozpowszechnia publicznie pliki PDF, coraz częściej oczekuje się tagowania — a nie tylko najlepszych praktyk.
Spróbuj edytować PDF
Nie wymaga instalacji. Działa bezpośrednio w Twojej przeglądarce.
