Теги PDF — это структурная основа доступного PDF. PDF с тегами содержит скрытые метаданные, описывающие, что представляет собой каждый элемент на странице: какой текст является заголовком, какой абзацем, какое изображение нуждается в описании, как структурированы таблицы, в каком порядке следует читать содержимое. Без тегов PDF представляет собой просто визуальный макет без машиночитаемой структуры.

Что такое теги PDF
Теги в PDF работают аналогично тегам HTML на веб-странице. Так же, как HTML использует <h1> для заголовков и <p> для абзацев теги PDF обозначают каждый элемент контента его типом и ролью. Дерево тегов — иерархическая структура, встроенная в PDF — описывает логическую организацию документа:
- <H1>, <H2>, <H3>: элементы заголовка на разных уровнях, обеспечивающие навигацию по заголовку.
- <P>: текст абзаца, наиболее распространенный элемент контента.
- <Рисунок>: изображения и графика, которые могут содержать альтернативные текстовые описания для программ чтения с экрана.
- <Table>, <TR>, <TD>: структуры таблиц со строками и ячейками, позволяющие программам чтения с экрана объявлять заголовки столбцов и строк.
- <L>, <LI>: list и элементы списка элементов, поэтому программы чтения с экрана объявляют «список из 5 элементов»; прежде чем читать каждую запись
Попробуйте отредактировать PDF
Никакой установки не требуется. Работает прямо в вашем браузере.
Почему тегирование имеет значение
Теги — это то, что делает PDF доступным для людей, использующих вспомогательные технологии. Программа чтения с экрана, обрабатывающая непомеченный PDF, не имеет возможности отличить заголовок от основного текста, не может определить, какой текст является заголовком ячейки таблицы, и не знает, какие изображения необходимо описать, а какие являются чисто декоративными. Опыт чтения становится запутанным или невозможным.
Помимо PDF Доступность, теги приносят пользу всем. Теги обеспечивают надежную перекомпоновку текста на маленьких экранах — PDF с тегами может перекомпоновать содержимое так, чтобы оно соответствовало дисплею телефона. Теги делают копирование более надежным, предоставляя информацию о порядке чтения. Теги обеспечивают лучшую поисковую индексацию системами управления документами. А бирки необходимы для соблюдения юридических стандартов доступности, включая раздел 508 в США и EN 301 549 в Европе.
Как проверить, имеет ли PDF тег
В Adobe Reader или Acrobat выберите «Файл» > Свойства > Вкладка «Описание». Найдите текст с тегом «Тег PDF: Да»; или «Помечено PDF: Нет». Быстрый функциональный тест: включите Read Out Loud (Вид > Read Out Loud > Activate Read Out Loud) и послушайте, как оглашается документ. Хорошо размеченный PDF читается логически; PDF без тегов или с плохим тегами либо вообще не читается, либо читает контент в запутанном порядке.
Средство проверки читаемости Acrobat Pro (Инструменты > Доступность > Полная проверка) предоставляет подробный отчет с указанием конкретных проблем с тегами — отсутствие альтернативного текста на изображениях, неправильная иерархия заголовков, таблицы без тегов заголовков и другие проблемы, влияющие на соответствие PDF Accessibility.
Как PDF-файлы помечаются тегами
Лучший способ получить PDF с тегами — это экспортировать его из хорошо структурированного исходного документа. Документы Microsoft Word, в которых используются правильные стили заголовков, форматирование списков и структурированные таблицы, автоматически экспортируются с тегами при использовании файла > Сохранить как > PDF. Структура тегов отражает иерархию заголовков и организацию содержимого документа.
Документы Google также экспортируют файлы PDF с тегами при загрузке в формате PDF. InDesign требует явных настроек специальных возможностей во время экспорта для создания тегов. Ключевым моментом во всех случаях является использование семантической структуры — правильных стилей заголовков, а не текста, выделенного жирным шрифтом вручную, форматирования списка, а не строк с отступами вручную, — которые механизм экспорта может сопоставить с тегами PDF.
Добавление тегов к существующему файлу без тегов PDF
Acrobat Pro может автоматически добавлять теги к существующему файлу PDF без тегов: Инструменты > Доступность > Добавьте теги в документ. Функция автоматической пометки анализирует макет страницы и пытается определить уровни заголовков, абзацев и структуру списка на основе визуального форматирования. Для простых документов автоматическая пометка работает хорошо. Для сложных макетов он создает отправную точку, которую необходимо просмотреть и исправить вручную.
Редактирование тегов вручную в Acrobat Pro осуществляется с помощью панели «Теги» («Просмотр» > «Показать/Скрыть» > «Панели навигации» > «Теги»). На панели отображается полное дерево тегов и можно добавлять, удалять, перемещать и повторно вводить теги. Это кропотливая работа — тщательное исправление сложного непомеченного PDF может занять несколько часов — но это единственный путь к полному обеспечению доступности, когда исходный документ недоступен.
Когда требуется маркировка
Правительственные учреждения, организации государственного сектора, образовательные учреждения и любые организации, получающие федеральное финансирование в США, обычно обязаны создавать доступные PDF в соответствии с разделом 508. Юридические документы, подаваемые в суды в электронном виде, которые требуют соблюдения требований к доступности, должны быть помечены. Корпоративным организациям все чаще требуются доступные PDF-файлы для кадровых документов, политик и внешних публикаций в рамках более широкого соблюдения PDF стандарта и обязательств по ESG. Если ваша организация распространяет PDF среди общественности, тегирование все чаще ожидается, а не просто лучшая практика.
Попробуйте отредактировать PDF
Никакой установки не требуется. Работает прямо в вашем браузере.
