Others

Что такое тегирование PDF и почему это важно?

Теги PDF — это структурная основа доступного PDF. PDF с тегами содержит скрытые метаданные, описывающие, что представляет собой каждый элемент на странице: какой текст является заголовком, какой абзацем, какое изображение нуждается в описании, как структурированы таблицы, в каком порядке следует читать содержимое. Без тегов PDF представляет собой просто визуальный макет без машиночитаемой структуры.

What Is PDF Tagging and Why Does It Matter?

Что такое теги PDF

Теги в PDF работают аналогично тегам HTML на веб-странице. Так же, как HTML использует <h1> для заголовков и <p> для абзацев теги PDF обозначают каждый элемент контента его типом и ролью. Дерево тегов — иерархическая структура, встроенная в PDF — описывает логическую организацию документа:

  • <H1>, <H2>, <H3>: элементы заголовка на разных уровнях, обеспечивающие навигацию по заголовку.
  • <P>: текст абзаца, наиболее распространенный элемент контента.
  • <Рисунок>: изображения и графика, которые могут содержать альтернативные текстовые описания для программ чтения с экрана.
  • <Table>, <TR>, <TD>: структуры таблиц со строками и ячейками, позволяющие программам чтения с экрана объявлять заголовки столбцов и строк.
  • <L>, <LI>: list и элементы списка элементов, поэтому программы чтения с экрана объявляют «список из 5 элементов»; прежде чем читать каждую запись
WukongPDF

Попробуйте отредактировать PDF

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →

Почему тегирование имеет значение

Теги — это то, что делает PDF доступным для людей, использующих вспомогательные технологии. Программа чтения с экрана, обрабатывающая непомеченный PDF, не имеет возможности отличить заголовок от основного текста, не может определить, какой текст является заголовком ячейки таблицы, и не знает, какие изображения необходимо описать, а какие являются чисто декоративными. Опыт чтения становится запутанным или невозможным.

Помимо PDF Доступность, теги приносят пользу всем. Теги обеспечивают надежную перекомпоновку текста на маленьких экранах — PDF с тегами может перекомпоновать содержимое так, чтобы оно соответствовало дисплею телефона. Теги делают копирование более надежным, предоставляя информацию о порядке чтения. Теги обеспечивают лучшую поисковую индексацию системами управления документами. А бирки необходимы для соблюдения юридических стандартов доступности, включая раздел 508 в США и EN 301 549 в Европе.

Как проверить, имеет ли PDF тег

В Adobe Reader или Acrobat выберите «Файл» > Свойства > Вкладка «Описание». Найдите текст с тегом «Тег PDF: Да»; или «Помечено PDF: Нет». Быстрый функциональный тест: включите Read Out Loud (Вид > Read Out Loud > Activate Read Out Loud) и послушайте, как оглашается документ. Хорошо размеченный PDF читается логически; PDF без тегов или с плохим тегами либо вообще не читается, либо читает контент в запутанном порядке.

Средство проверки читаемости Acrobat Pro (Инструменты > Доступность > Полная проверка) предоставляет подробный отчет с указанием конкретных проблем с тегами — отсутствие альтернативного текста на изображениях, неправильная иерархия заголовков, таблицы без тегов заголовков и другие проблемы, влияющие на соответствие PDF Accessibility.

Как PDF-файлы помечаются тегами

Лучший способ получить PDF с тегами — это экспортировать его из хорошо структурированного исходного документа. Документы Microsoft Word, в которых используются правильные стили заголовков, форматирование списков и структурированные таблицы, автоматически экспортируются с тегами при использовании файла > Сохранить как > PDF. Структура тегов отражает иерархию заголовков и организацию содержимого документа.

Документы Google также экспортируют файлы PDF с тегами при загрузке в формате PDF. InDesign требует явных настроек специальных возможностей во время экспорта для создания тегов. Ключевым моментом во всех случаях является использование семантической структуры — правильных стилей заголовков, а не текста, выделенного жирным шрифтом вручную, форматирования списка, а не строк с отступами вручную, — которые механизм экспорта может сопоставить с тегами PDF.

Добавление тегов к существующему файлу без тегов PDF

Acrobat Pro может автоматически добавлять теги к существующему файлу PDF без тегов: Инструменты > Доступность > Добавьте теги в документ. Функция автоматической пометки анализирует макет страницы и пытается определить уровни заголовков, абзацев и структуру списка на основе визуального форматирования. Для простых документов автоматическая пометка работает хорошо. Для сложных макетов он создает отправную точку, которую необходимо просмотреть и исправить вручную.

Редактирование тегов вручную в Acrobat Pro осуществляется с помощью панели «Теги» («Просмотр» > «Показать/Скрыть» > «Панели навигации» > «Теги»). На панели отображается полное дерево тегов и можно добавлять, удалять, перемещать и повторно вводить теги. Это кропотливая работа — тщательное исправление сложного непомеченного PDF может занять несколько часов — но это единственный путь к полному обеспечению доступности, когда исходный документ недоступен.

Когда требуется маркировка

Правительственные учреждения, организации государственного сектора, образовательные учреждения и любые организации, получающие федеральное финансирование в США, обычно обязаны создавать доступные PDF в соответствии с разделом 508. Юридические документы, подаваемые в суды в электронном виде, которые требуют соблюдения требований к доступности, должны быть помечены. Корпоративным организациям все чаще требуются доступные PDF-файлы для кадровых документов, политик и внешних публикаций в рамках более широкого соблюдения PDF стандарта и обязательств по ESG. Если ваша организация распространяет PDF среди общественности, тегирование все чаще ожидается, а не просто лучшая практика.

WukongPDF

Попробуйте отредактировать PDF

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →