Tips & Tricks

Как сделать PDF доступным для программ чтения с экрана

PDF, который выглядит идеально отформатированным на экране, может быть совершенно нечитаемым для тех, кто использует программу чтения с экрана. Программы чтения с экрана — программы, используемые людьми с нарушениями зрения для чтения документов вслух — полагаются на базовую структуру PDF, а не на его внешний вид. Документ, который выглядит организованным визуально, может вообще не иметь никакой значимой структуры с точки зрения программного обеспечения. Вот что делает PDF доступным и как туда добраться.

How to Make a PDF Accessible for Screen Readers

Почему большинство PDF-файлов недоступны по умолчанию

Когда вы экспортируете документ Word или файл дизайна в PDF, визуальный результат выглядит правильно, но структурная информация часто отсутствует или неверна. Заголовки, которые выглядят жирными и большими на экране, могут не иметь тега заголовка в базовой структуре PDF. Столбцы, визуально расположенные рядом, можно читать слева направо по обеим колонкам, а не вниз по каждой. Изображения не имеют описания, если вы его специально не добавите.

Программы чтения с экрана следуют структуре тегов документа, а не его визуальному макету. Если эта структура отсутствует или неверна, порядок чтения становится непредсказуемым — содержимое боковых панелей смешивается с основным текстом, таблицы читаются ячейка за ячейкой в ​​неправильном порядке, а заголовки, которые должны помочь в навигации, неотличимы от основного текста.

WukongPDF

Попробуйте «Редактировать PDF»

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →

Начните с исходного документа, а не PDF

Доступность гораздо проще реализовать в исходном коде, чем модифицировать готовый PDF. Если вы работаете в Word, структурные решения, которые вы принимаете перед экспортом, определяют большую часть доступности полученного PDF.

Используйте настоящие стили заголовков

Не создавайте внешний вид заголовка, делая текст жирным и крупным — используйте встроенные в Word стили «Заголовок 1», «Заголовок 2», «Заголовок 3». Они экспортируются в PDF как правильно помеченные заголовки, по которым могут перемещаться программы чтения с экрана. Документ с реальной структурой заголовков позволяет пользователю программы чтения с экрана сразу перейти к любому разделу точно так же, как зрячие пользователи могут сканировать его визуально.

Добавьте альтернативный текст к каждому изображению

Каждое изображение, диаграмма, диаграмма и графика в вашем документе нуждаются в описательном замещающем тексте — кратком описании того, что показывает изображение и почему оно там. В Word щелкните правой кнопкой мыши любое изображение и выберите «Редактировать замещающий текст». Диаграмма, показывающая квартальный рост выручки, может иметь замещающий текст, например: «Гистограмма, показывающая выручку за 1-4 кварталы 2024 года, причем в 3-м квартале показано самое высокое значение — 2,4 миллиона долларов». Без этого программа чтения с экрана объявляет «изображение»; и идет дальше — контент теряется.

Создавайте таблицы с правильной структурой

Таблицы являются распространенной проблемой доступности. Таблица без строк заголовка для программы чтения с экрана представляет собой просто сетку ячеек — невозможно узнать, какому столбцу принадлежит значение. В Word отметьте верхнюю строку любой таблицы как строку заголовка («Свойства таблицы» > «Строка» > «Повторить как строку заголовка»). По возможности избегайте объединения ячеек и не используйте таблицы исключительно для визуального макета — программы чтения с экрана читают ячейки таблицы по порядку, а таблица макета создает впечатление, которое не имеет смысла.

Используйте реальные списки, а не форматирование вручную

Если вы создаете список, вводя тире или цифру в начале каждой строки, это не список для программы чтения с экрана — это серия отдельных абзацев, которые начинаются с символа. Используйте встроенное в Word форматирование списков (маркированный список или кнопки нумерованного списка) для создания списков, которые экспортируются как элементы списка с правильными тегами.

Настройки экспорта, влияющие на специальные возможности

При экспорте из Word в PDF имеет значение используемый вами метод. Встроенный экспорт Word PDF (Файл > Сохранить как > PDF) сохраняет больше структурной информации, чем печать на принтере PDF. В диалоговом окне экспорта найдите параметры, связанные с тегами доступности или структуры документа — они должны быть включены.

В частности, в параметрах экспорта PDF Word: включите «Теги структуры документа для специальных возможностей»; если опция доступна. Это переносит структуру заголовков, теги списка и заголовки таблиц в PDF. Без этой опции даже хорошо структурированный документ Word можно экспортировать в PDF, который вообще не имеет структуры тегов.

Отсканированные PDF-файлы никогда не будут доступны без OCR

Отсканированный PDF представляет собой изображение. Здесь нет ни текста, ни структуры, ни программы чтения с экрана. Для программы чтения с экрана отсканированный PDF совершенно пустой — программа объявляет, что документ открыт, и после этого ему нечего читать.

Запуск отсканированного документа с помощью инструмента OCR PDF — это первый шаг к тому, чтобы сделать его доступным. OCR преобразует изображение в реальный текст, с которым затем могут работать программы чтения с экрана. Инструмент оптического распознавания символов WukongPDF на сайте www.wukongpdf.com справляется с этой задачей — загрузите отсканированный PDF, обработайте его и загрузите версию с реальным, читаемым текстом. Обратите внимание, что само по себе распознавание текста не создает полностью доступный PDF с тегами; для полного соответствия необходима дополнительная работа с тегами в Adobe Acrobat Pro. Но OCR — это важный первый шаг, без которого ничего больше невозможно.

Как проверить, доступен ли ваш PDF

Самый простой тест: попробуйте выделить и прочитать текст в PDF. Если вы можете выделять слова и порядок чтения имеет смысл при выборе сверху вниз, документ содержит реальный текст в разумном порядке. Если выбор скачет или ничего не выделяется, у вас проблема.

Для более тщательной проверки в Adobe Acrobat Pro имеется встроенная функция проверки доступности («Инструменты» > «Доступность» > «Полная проверка»), которая выявляет конкретные проблемы. Бесплатные онлайн-инструменты, такие как PAC (PDF Accessibility Checker), обеспечивают аналогичный анализ без необходимости использования Acrobat Pro.

Самый надежный тест — открыть документ в программе чтения с экрана и послушать, как он читается. NVDA (бесплатно, Windows) и VoiceOver (встроен в Mac и iOS) позволяют просматривать документ так же, как это сделал бы пользователь программы чтения с экрана. Если порядок чтения логичен и заголовки помогают ориентироваться, все в порядке. Если это звучит как случайный набор текстовых фрагментов, значит, нужно провести структурную работу.

WukongPDF

Попробуйте «Редактировать PDF»

Никакой установки не требуется. Работает прямо в вашем браузере.

Начать →