Conformidad con PDF/A: su guía para el archivo de documentos a largo plazo
Todo lo que necesita saber sobre los estándares PDF/A, los niveles de conformidad y cómo crear documentos que permanezcan legibles durante décadas.
Qué es PDF/A y por qué existe
PDF/A es una familia de estándares ISO (ISO 19005) diseñada para la preservación a largo plazo de documentos electrónicos. Mientras que los PDF estándar pueden depender de recursos externos (fuentes, perfiles de color, complementos multimedia) que pueden dejar de estar disponibles con el tiempo, PDF/A exige que un documento sea completamente autónomo, asegurando que se renderizará de manera idéntica dentro de décadas o siglos, independientemente del software o sistema operativo utilizado para abrirlo.
La necesidad de PDF/A surgió de la creciente dependencia de los documentos digitales en contextos legales, gubernamentales y empresariales. Los registros judiciales, los historiales médicos, los estados financieros y los archivos gubernamentales deben permanecer legibles y legalmente válidos durante décadas. Un PDF estándar creado en 2005 podría depender de una fuente específica que ya no se distribuye, un video incrustado que requiere un códec obsoleto, o JavaScript que hace referencia a un servicio web extinto. PDF/A elimina estas dependencias.
PDF/A se publicó por primera vez como ISO 19005-1 en 2005 (PDF/A-1), basado en PDF 1.4. Las versiones posteriores han ampliado el estándar: PDF/A-2 (2011, basado en PDF 1.7) añadió soporte para JPEG2000, transparencia, capas y adjuntos PDF/A. PDF/A-3 (2012) permitió además que archivos no PDF/A se adjuntaran. PDF/A-4 (2020, basado en PDF 2.0) simplificó los niveles de conformidad y actualizó la especificación base. Cada versión aborda las necesidades evolutivas de la preservación digital manteniendo el principio fundamental de la autonomía.
Niveles de conformidad explicados
PDF/A define múltiples niveles de conformidad que especifican diferentes grados de cumplimiento. PDF/A-1 define dos niveles: El Nivel B (básico) asegura la reproducibilidad visual, lo que significa que el documento se verá igual cuando se renderice. El Nivel A (accesible) añade requisitos para la estructura lógica del documento y la extracción de texto, esencialmente requiriendo que el documento esté etiquetado y sea accesible. La conformidad de Nivel A es significativamente más exigente porque requiere una estructura de etiquetas adecuada, mapeo de caracteres Unicode y especificación de idioma.
PDF/A-2 introdujo un tercer nivel: el Nivel U (Unicode), que se sitúa entre B y A. El Nivel U requiere que todo el texto del documento tenga equivalentes Unicode, asegurando que el texto pueda buscarse y extraerse, sin requerir el etiquetado estructural completo del Nivel A. Esto abordó una brecha práctica, ya que muchas organizaciones necesitaban documentos con capacidad de búsqueda pero encontraban el etiquetado del Nivel A demasiado oneroso.
Para la mayoría de las organizaciones, la elección entre niveles de conformidad implica compromisos entre esfuerzo y capacidad. El Nivel B es el más fácil de lograr y es suficiente si el objetivo es puramente la preservación visual. El Nivel U añade capacidad de búsqueda de texto con un esfuerzo adicional modesto. El Nivel A es requerido cuando la accesibilidad es obligatoria o cuando debe preservarse la semántica estructural del documento. Las agencias gubernamentales de muchos países requieren el Nivel A para documentos públicos, mientras que el Nivel B o U puede ser suficiente para archivos internos.
Requisitos y restricciones clave
PDF/A logra la preservación a largo plazo prohibiendo características que crean dependencias externas o ambigüedad. Comprender estas restricciones es esencial para crear documentos conformes. Las fuentes deben estar completamente incrustadas, incluyendo todos los glifos utilizados en el documento. Esto evita fallos de renderizado cuando las fuentes no están disponibles en el sistema del visor. El subconjunto de fuentes está permitido (incrustar solo los glifos utilizados), pero el subconjunto incrustado debe ser suficiente para renderizar todo el texto.
Toda la información de color debe ser independiente del dispositivo. PDF/A requiere ya sea una intención de salida (un perfil de color ICC que describe el renderizado previsto) o el uso exclusivo de espacios de color independientes del dispositivo como CalRGB, CalGray o Lab. Los espacios de color dependientes del dispositivo (DeviceRGB, DeviceCMYK, DeviceGray) solo se permiten cuando hay una intención de salida presente. Esto asegura que los colores se definan en términos absolutos en lugar de depender de una impresora o pantalla específica.
JavaScript está completamente prohibido en PDF/A. Los scripts crean comportamientos impredecibles y dependencias externas. Del mismo modo, el cifrado no está permitido porque podría impedir el acceso futuro si la contraseña se pierde. El contenido multimedia (audio, video) está prohibido en PDF/A-1 pero permitido en PDF/A-2 y PDF/A-3 con restricciones. Las referencias a contenido externo (URLs, enlaces de archivos) están prohibidas porque el contenido referenciado puede no existir en el futuro. Todo el contenido referenciado debe estar incrustado dentro del documento.
Creación de documentos conformes con PDF/A
La forma más fiable de crear documentos conformes con PDF/A es generarlos directamente desde la aplicación de creación. Microsoft Office, LibreOffice e InDesign admiten la exportación a PDF/A. En Microsoft Word, use Archivo > Guardar como > PDF y haga clic en Opciones para seleccionar un nivel de conformidad PDF/A. LibreOffice ofrece PDF/A-1b, PDF/A-2b y PDF/A-3b en sus opciones de exportación PDF. InDesign proporciona control detallado sobre la configuración de PDF/A a través de sus ajustes preestablecidos de exportación PDF.
Al crear documentos destinados a PDF/A, tenga en cuenta las restricciones desde el principio. Use fuentes estándar o fuentes que tenga derecho a incrustar. Evite efectos de transparencia en PDF/A-1 (aunque PDF/A-2 y posteriores permiten transparencia). Use gráficos vectoriales en lugar de imágenes de baja resolución cuando sea posible. Asegúrese de que todas las imágenes estén incrustadas en lugar de enlazadas. Establezca el idioma del documento en las propiedades del documento.
Para la conformidad con PDF/A Nivel A, use estilos de encabezado adecuados, cree contenido etiquetado usando las funciones de estructura de la aplicación de creación, añada texto alternativo a todas las imágenes y asegúrese de que las tablas estén correctamente estructuradas con encabezados. Si el documento es complejo, planifique la estructura de etiquetas antes de comenzar a crear contenido. Adaptar la accesibilidad a un documento completado es significativamente más costoso en tiempo que incorporarla desde el principio.
Conversión de PDF existentes a PDF/A
Convertir PDF existentes al formato PDF/A es un requisito común, particularmente para organizaciones que digitalizan colecciones de documentos heredados. La herramienta Preflight de Adobe Acrobat Pro incluye varios perfiles de conversión a PDF/A que analizan un PDF, identifican elementos no conformes e intentan corregirlos automáticamente. El proceso de conversión puede incrustar fuentes faltantes, convertir espacios de color, eliminar JavaScript y aplanar transparencias.
La conversión automática funciona bien para documentos simples, pero a menudo requiere intervención manual para los complejos. Los problemas comunes que impiden la conversión automática incluyen fuentes faltantes (si la fuente original no se puede localizar, el conversor puede sustituir una fuente diferente, alterando la apariencia del documento), colores dependientes del dispositivo sin una intención de salida, y contenido externo referenciado que debe ser incrustado o eliminado.
Las herramientas de código abierto proporcionan alternativas para la conversión por lotes. Ghostscript puede convertir PDF a PDF/A usando configuraciones específicas de dispositivo de salida. La herramienta VeraPDF valida la conformidad con PDF/A y proporciona informes detallados de no conformidades. LibreOffice puede convertir documentos de oficina a PDF/A por lotes mediante scripting de línea de comandos. Para proyectos de conversión a gran escala, las herramientas comerciales como ABBYY FineReader, Foxit PDF Editor y callas pdfaPilot ofrecen procesamiento por lotes con informes detallados y mayores tasas de éxito para documentos complejos.
Validación de la conformidad con PDF/A
Crear un PDF y seleccionar PDF/A en las opciones de exportación no garantiza la conformidad. Muchas herramientas de creación producen archivos que afirman ser PDF/A (al incluir los metadatos apropiados) pero contienen elementos no conformes. La validación utilizando una herramienta dedicada es esencial.
VeraPDF es el validador estándar de la industria de código abierto para documentos PDF/A. Desarrollado como parte del proyecto europeo PREFORMA, valida todas las partes y niveles de conformidad del estándar PDF/A. VeraPDF proporciona informes detallados que enumeran cada violación de conformidad, categorizada por gravedad y con referencias a la cláusula relevante del estándar ISO. Puede utilizarse como aplicación GUI, herramienta de línea de comandos, o integrarse en flujos de trabajo a través de su API REST.
La herramienta Preflight de Adobe Acrobat Pro también valida la conformidad con PDF/A y puede intentar corregir los problemas identificados. Los perfiles de Preflight para PDF/A son completos y se actualizan regularmente. Callas pdfaPilot proporciona capacidades tanto de validación como de corrección y se utiliza ampliamente en flujos de trabajo de producción.
Al validar, pruebe el documento en el nivel de conformidad específico que pretende. Un documento que pasa la validación de PDF/A-1b puede fallar la validación de PDF/A-1a debido a etiquetas faltantes. Del mismo modo, un documento conforme con PDF/A-1b puede usar características (como JPEG2000 o transparencia) que hagan que falle PDF/A-1b pero pase PDF/A-2b. Establezca un paso de validación en su flujo de trabajo de producción de documentos para detectar problemas de conformidad antes de la distribución o el archivo.
PDF/A en contextos específicos de la industria
Diferentes industrias han adoptado PDF/A de maneras específicas que reflejan sus necesidades de preservación. En la industria legal, PDF/A se requiere cada vez más para presentaciones judiciales y retención de documentos. El sistema de tribunales federales de EE. UU. (PACER/CM/ECF) acepta documentos PDF/A, y algunas jurisdicciones lo exigen. Los bufetes de abogados usan PDF/A para archivar expedientes de casos, contratos y correspondencia, asegurando que estos registros permanezcan accesibles durante todo su período de retención, que puede abarcar décadas.
Las organizaciones de atención médica usan PDF/A para archivar registros médicos, documentación de ensayos clínicos y presentaciones regulatorias. La FDA acepta PDF/A para presentaciones electrónicas, y muchos sistemas de registros médicos electrónicos (EHR) pueden exportar documentos en formato PDF/A. Los largos requisitos de retención para registros médicos (a menudo más de 10 años para adultos y más para registros pediátricos) hacen que las garantías de preservación de PDF/A sean particularmente valiosas.
Las agencias gubernamentales se encuentran entre los mayores adoptantes de PDF/A. Los Archivos Nacionales de EE. UU. (NARA) recomiendan PDF/A como formato preferido para registros electrónicos permanentes. La Unión Europea requiere PDF/A para publicaciones oficiales y documentos legislativos. Muchas bibliotecas y archivos nacionales en todo el mundo han adoptado PDF/A como parte de sus estrategias de preservación digital. Las instituciones financieras usan PDF/A para el cumplimiento regulatorio, archivando registros de transacciones, estados de cuenta y documentación de auditoría en un formato al que los reguladores pueden acceder de manera fiable durante las inspecciones.