Accesibilidad en PDF: creación de documentos inclusivos para todos los usuarios

Por qué importa la accesibilidad en PDF

La accesibilidad en PDF garantiza que las personas con discapacidades puedan percibir, comprender, navegar e interactuar con documentos PDF. Según la Organización Mundial de la Salud, más de mil millones de personas en todo el mundo viven con alguna forma de discapacidad. Esto incluye discapacidades visuales (ceguera, baja visión, daltonismo), discapacidades motoras que afectan el uso del ratón, discapacidades cognitivas que impactan la comprensión lectora y discapacidades auditivas relevantes para PDF multimedia.

Más allá del imperativo ético, la accesibilidad es cada vez más un requisito legal. En Estados Unidos, la Ley de Estadounidenses con Discapacidades (ADA) ha sido interpretada por los tribunales como aplicable a los documentos digitales, incluidos los PDF. La Sección 508 de la Ley de Rehabilitación requiere explícitamente que las agencias federales hagan accesibles los documentos electrónicos. La Ley Europea de Accesibilidad (EAA) impone requisitos similares en los estados miembros de la UE. Las organizaciones que no proporcionan documentos accesibles enfrentan responsabilidad legal, como lo demuestran numerosas demandas tanto contra agencias gubernamentales como contra empresas privadas.

Los PDF accesibles también benefician a los usuarios sin discapacidades. Un PDF bien etiquetado con un orden de lectura adecuado, marcadores y una estructura clara es más fácil de navegar para todos. Los motores de búsqueda pueden indexar mejor los PDF accesibles, mejorando la capacidad de descubrimiento. Las funciones de reflujo de texto habilitadas por un etiquetado adecuado permiten que los documentos se lean cómodamente en dispositivos móviles. Invertir en accesibilidad mejora la calidad general y la usabilidad de sus documentos para todos los lectores.

Comprensión de las etiquetas PDF y la estructura del documento

Las etiquetas PDF son la base de la accesibilidad del documento. Un PDF etiquetado contiene un árbol de estructura lógica que identifica el papel de cada elemento en la página: encabezados, párrafos, listas, tablas, imágenes, etc. Este árbol de estructura es independiente del diseño visual y proporciona la información que las tecnologías de asistencia como los lectores de pantalla necesitan para presentar el contenido de manera significativa.

El conjunto de etiquetas PDF está definido en la especificación PDF y es paralelo a los elementos HTML. Las etiquetas comunes incluyen P (párrafo), H1 a H6 (encabezados), L y LI (listas y elementos de lista), Table, TR, TH y TD (estructura de tablas), Figure (imágenes y gráficos), Link (hipervínculos) y Span (texto en línea con propiedades específicas). Cada etiqueta puede tener atributos que proporcionan información adicional, como idioma, texto alternativo o alcance para encabezados de tabla.

La creación de PDF etiquetados comienza en la aplicación de creación. Microsoft Word, Google Docs, InDesign y LibreOffice admiten la generación de PDF etiquetados si utiliza sus estilos y funciones de estructura integrados. Usar el estilo Encabezado 1 en lugar de simplemente hacer el texto en negrita y grande crea una etiqueta H1 adecuada en el PDF exportado. Usar la función de lista integrada en lugar de escribir viñetas manualmente crea etiquetas de lista adecuadas. El principio clave es usar marcado semántico en el documento de origen, que luego se traslada a la exportación PDF.

Orden de lectura y reflujo de contenido

El orden de lectura determina la secuencia en la que un lector de pantalla presenta el contenido. En un PDF visual, el orden de lectura puede parecer obvio según el diseño, pero el flujo de contenido subyacente puede almacenar los objetos en una secuencia diferente. Un diseño de dos columnas, por ejemplo, podría almacenar todo el texto de izquierda a derecha a través de ambas columnas, causando que un lector de pantalla lea a través de las columnas en lugar de hacia abajo en cada columna secuencialmente.

El árbol de estructura lógica en un PDF etiquetado especifica el orden de lectura correcto independientemente del diseño visual. Al crear PDF, verifique el orden de lectura usando las herramientas de accesibilidad en Adobe Acrobat (Ver > Orden de lectura) o usando un lector de pantalla para escuchar el documento. Los problemas comunes incluyen encabezados y pies de página que se leen en medio del contenido del cuerpo, texto de barras laterales que interrumpe la narrativa principal y pies de figuras que se separan de sus figuras.

El reflujo de contenido está estrechamente relacionado con el orden de lectura. Cuando un usuario hace zoom o ve un PDF en una pantalla pequeña, un PDF con capacidad de reflujo reorganiza su contenido para ajustarse al ancho de la ventana, de manera similar a como una página web responde a diferentes tamaños de pantalla. Esto requiere un etiquetado adecuado porque el motor de reflujo utiliza la estructura de etiquetas para determinar cómo se debe reorganizar el contenido. Sin etiquetas, el visor de PDF no puede distinguir un encabezado del texto del cuerpo ni determinar dónde termina un párrafo, lo que hace imposible el reflujo. Pruebe el reflujo usando la opción Ver > Zoom > Reflujo en Adobe Acrobat.

Imágenes, figuras y texto alternativo

Toda imagen significativa en un PDF accesible debe tener texto alternativo que transmita el contenido o la función de la imagen a los usuarios que no pueden verla. El texto alternativo se almacena como el atributo Alt en una etiqueta Figure en el árbol de estructura del PDF. Escribir texto alternativo eficaz es una habilidad: debe ser conciso (generalmente menos de 150 caracteres), describir el contenido en lugar de la apariencia y transmitir la información que la imagen pretende comunicar.

Para imágenes complejas como gráficos, diagramas y esquemas, un texto alternativo breve puede ser insuficiente. En estos casos, proporcione una descripción más larga ya sea en el cuerpo del documento adyacente a la figura o como una descripción extendida enlazada desde la imagen. Un gráfico de barras, por ejemplo, podría tener un texto alternativo de «Comparación de ingresos trimestrales» con una tabla de datos en el cuerpo del documento que proporcione las cifras reales.

Las imágenes decorativas que no sirven a ningún propósito informativo deben marcarse como artefactos en lugar de etiquetarse como figuras. Los artefactos son ignorados por los lectores de pantalla, evitando interrupciones innecesarias. Los bordes de página, patrones de fondo, separadores decorativos y marcas de agua son típicamente artefactos. En Adobe Acrobat, puede cambiar un elemento a artefacto a través de la herramienta de orden de lectura o el árbol de etiquetas. En las aplicaciones de creación, marcar una imagen como decorativa antes de la exportación PDF generalmente genera la marca de artefacto correcta.

Accesibilidad de tablas

Las tablas son de los elementos más difíciles de hacer accesibles en PDF. Un lector de pantalla navega las tablas celda por celda, y necesita saber qué celdas son encabezados y cuáles son celdas de datos, y cómo se relacionan los encabezados con las celdas de datos. Sin esta información, un lector de pantalla simplemente lee las celdas en secuencia, lo que se vuelve incomprensible para cualquier tabla no trivial.

La accesibilidad adecuada de tablas requiere el uso correcto de las etiquetas TH (encabezado de tabla) y TD (dato de tabla), junto con atributos de alcance que indiquen si un encabezado se aplica a su fila, columna o a un grupo de filas o columnas. Para tablas simples con una sola fila de encabezado, cada celda de la primera fila debe etiquetarse como TH con scope="Column". Para tablas con encabezados de fila y columna, el atributo scope en cada celda de encabezado aclara su relación.

Las tablas complejas con celdas combinadas, encabezados anidados o estructuras irregulares son particularmente difíciles. La especificación PDF admite el atributo Headers en las celdas de datos, que enumera los ID de las celdas de encabezado asociadas, similar al atributo headers en tablas HTML. Sin embargo, generar estos atributos automáticamente no es fiable, y a menudo se requiere corrección manual. Cuando sea posible, simplifique las tablas complejas dividiéndolas en múltiples tablas más sencillas. Evite usar tablas para el diseño visual en lugar de datos tabulares, ya que esto crea una estructura confusa para los usuarios de lectores de pantalla.

Formularios y elementos interactivos

Los formularios PDF accesibles requieren que cada campo de formulario tenga una etiqueta descriptiva, que el orden de tabulación siga una secuencia lógica y que la validación de campos proporcione mensajes de error claros. Cada campo de texto, casilla de verificación, botón de opción, menú desplegable y botón debe tener una información sobre herramientas o etiqueta que describa su propósito. La etiqueta debe estar asociada programáticamente con el campo para que un lector de pantalla la anuncie cuando el usuario navegue al campo.

El orden de tabulación debe seguir el orden visual de lectura del formulario. De forma predeterminada, los formularios PDF pueden tabular a través de los campos en el orden en que fueron creados en lugar de su posición visual. En Adobe Acrobat, puede configurar el orden de tabulación por estructura de página, orden de fila u orden de columna, o definir un orden personalizado. Pruebe el orden de tabulación abriendo el formulario y presionando Tab repetidamente para verificar que el foco se mueva lógicamente a través de los campos.

Proporcione instrucciones claras al principio del formulario explicando cómo completarlo. Marque los campos obligatorios de manera consistente e indique la convención de campos obligatorios en las instrucciones. Use validación de campos para prevenir errores comunes, pero asegúrese de que los mensajes de validación sean accesibles. Cuando un usuario envía un formulario con errores, el mensaje de error debe identificar qué campo tiene el error y qué corrección se necesita. Para formularios complejos, considere proporcionar una alternativa basada en texto o un formulario web que pueda ser más fácil de hacer completamente accesible.

Pruebas y validación de la accesibilidad de PDF

Las pruebas automatizadas detectan muchos problemas de accesibilidad, pero no pueden evaluar todos los aspectos de la accesibilidad. Adobe Acrobat Pro incluye un verificador de accesibilidad integrado que comprueba el contenido etiquetado, el orden de lectura, el texto alternativo, la estructura de tablas y otros requisitos. PAC (PDF Accessibility Checker) de la fundación suiza Access For All es una herramienta gratuita que proporciona pruebas más detalladas contra los estándares PDF/UA (Accesibilidad Universal).

Las herramientas automatizadas pueden verificar que existen etiquetas, que las imágenes tienen texto alternativo y que las tablas tienen celdas de encabezado. Sin embargo, no pueden determinar si el texto alternativo es significativo, si el orden de lectura tiene sentido en contexto, o si los encabezados describen con precisión el contenido que sigue. La revisión manual es esencial para estos aspectos cualitativos.

La prueba de accesibilidad más efectiva es usar el documento con tecnología de asistencia real. NVDA (gratuito, Windows) y JAWS (comercial, Windows) son los lectores de pantalla más comúnmente utilizados para documentos PDF. VoiceOver (integrado en macOS e iOS) también lee PDF. Navegue por el documento usando solo el teclado y el lector de pantalla, verificando que todo el contenido se anuncia, que el orden de lectura es lógico, que las imágenes se describen y que los campos de formulario están etiquetados. Si es posible, incluya a personas con discapacidades en su proceso de pruebas. Su experiencia vivida revela problemas de usabilidad que las herramientas automatizadas y los evaluadores sin discapacidad visual a menudo pasan por alto.