Retour à tous les guides

Conformité PDF/A : votre guide pour l'archivage de documents à long terme

Tout ce que vous devez savoir sur les normes PDF/A, les niveaux de conformité, et comment créer des documents qui restent lisibles pendant des décennies.

Matthias Baertschi
Founder & Lead Engineer
8 min

Qu'est-ce que le PDF/A et pourquoi existe-t-il

Le PDF/A est une famille de normes ISO (ISO 19005) conçues pour la préservation à long terme des documents électroniques. Alors que les PDF standard peuvent dépendre de ressources externes (polices, profils colorimétriques, plugins multimédias) qui peuvent devenir indisponibles au fil du temps, le PDF/A impose qu'un document soit entièrement autonome, garantissant qu'il sera rendu de manière identique des décennies ou des siècles plus tard, quel que soit le logiciel ou le système d'exploitation utilisé pour l'ouvrir.

Le besoin du PDF/A est né de la dépendance croissante aux documents numériques dans les contextes juridiques, gouvernementaux et commerciaux. Les dossiers judiciaires, les antécédents médicaux, les états financiers et les archives gouvernementales doivent rester lisibles et juridiquement valides pendant des décennies. Un PDF standard créé en 2005 pourrait dépendre d'une police spécifique qui n'est plus distribuée, d'une vidéo intégrée nécessitant un codec obsolète, ou d'un JavaScript référençant un service web disparu. Le PDF/A élimine ces dépendances.

Le PDF/A a été publié pour la première fois en tant qu'ISO 19005-1 en 2005 (PDF/A-1), basé sur PDF 1.4. Les versions ultérieures ont étendu la norme : le PDF/A-2 (2011, basé sur PDF 1.7) a ajouté la prise en charge du JPEG2000, de la transparence, des calques et des pièces jointes PDF/A. Le PDF/A-3 (2012) a en outre permis l'attachement de fichiers non PDF/A. Le PDF/A-4 (2020, basé sur PDF 2.0) a simplifié les niveaux de conformité et mis à jour la spécification de base. Chaque version répond aux besoins évolutifs de la préservation numérique tout en maintenant le principe fondamental d'autonomie.

Les niveaux de conformité expliqués

Le PDF/A définit plusieurs niveaux de conformité qui spécifient différents degrés de respect de la norme. Le PDF/A-1 définit deux niveaux : le niveau B (basique) assure la reproductibilité visuelle, ce qui signifie que le document aura le même aspect lors du rendu. Le niveau A (accessible) ajoute des exigences de structure logique du document et d'extraction de texte, exigeant essentiellement que le document soit balisé et accessible. La conformité au niveau A est nettement plus exigeante car elle nécessite une structure de balises appropriée, un mappage de caractères Unicode et une spécification de langue.

Le PDF/A-2 a introduit un troisième niveau : le niveau U (Unicode), qui se situe entre B et A. Le niveau U exige que tout le texte du document ait des équivalents Unicode, garantissant que le texte puisse être recherché et extrait, sans nécessiter le balisage structurel complet du niveau A. Cela a comblé un écart pratique, car de nombreuses organisations avaient besoin de documents consultables mais trouvaient le balisage du niveau A trop contraignant.

Pour la plupart des organisations, le choix entre les niveaux de conformité implique des compromis entre l'effort et les capacités. Le niveau B est le plus facile à atteindre et suffit si l'objectif est purement la préservation visuelle. Le niveau U ajoute la possibilité de recherche textuelle avec un effort supplémentaire modeste. Le niveau A est requis lorsque l'accessibilité est imposée ou lorsque la sémantique structurelle du document doit être préservée. Les agences gouvernementales de nombreux pays exigent le niveau A pour les documents destinés au public, tandis que le niveau B ou U peut suffire pour les archives internes.

Exigences et restrictions principales

Le PDF/A assure la préservation à long terme en interdisant les fonctionnalités qui créent des dépendances externes ou de l'ambiguïté. Comprendre ces restrictions est essentiel pour créer des documents conformes. Les polices doivent être entièrement intégrées, y compris tous les glyphes utilisés dans le document. Cela empêche les échecs de rendu lorsque les polices ne sont pas disponibles sur le système du lecteur. Le sous-ensemble de polices est autorisé (intégration uniquement des glyphes utilisés), mais le sous-ensemble intégré doit être suffisant pour rendre tout le texte.

Toutes les informations de couleur doivent être indépendantes du périphérique. Le PDF/A exige soit une intention de sortie (un profil colorimétrique ICC décrivant le rendu prévu), soit l'utilisation exclusive d'espaces colorimétriques indépendants du périphérique comme CalRGB, CalGray ou Lab. Les espaces colorimétriques dépendants du périphérique (DeviceRGB, DeviceCMYK, DeviceGray) ne sont autorisés que lorsqu'une intention de sortie est présente. Cela garantit que les couleurs sont définies en termes absolus plutôt que dépendantes d'une imprimante ou d'un écran spécifique.

Le JavaScript est entièrement interdit dans le PDF/A. Les scripts créent un comportement imprévisible et des dépendances externes. De même, le chiffrement n'est pas autorisé car il pourrait empêcher l'accès futur si le mot de passe est perdu. Le contenu multimédia (audio, vidéo) est interdit dans le PDF/A-1 mais autorisé dans le PDF/A-2 et le PDF/A-3 avec des restrictions. Les références à du contenu externe (URL, liens de fichiers) sont interdites car le contenu référencé pourrait ne plus exister à l'avenir. Tout le contenu référencé doit être intégré dans le document.

Créer des documents conformes au PDF/A

Le moyen le plus fiable de créer des documents conformes au PDF/A est de les générer directement depuis l'application de rédaction. Microsoft Office, LibreOffice et InDesign prennent tous en charge l'export PDF/A. Dans Microsoft Word, utilisez Fichier > Enregistrer sous > PDF et cliquez sur Options pour sélectionner un niveau de conformité PDF/A. LibreOffice propose le PDF/A-1b, le PDF/A-2b et le PDF/A-3b dans ses options d'export PDF. InDesign offre un contrôle détaillé sur les paramètres PDF/A via ses préréglages d'export PDF.

Lors de la création de documents destinés au PDF/A, gardez les restrictions à l'esprit dès le départ. Utilisez des polices standard ou des polices que vous avez le droit d'intégrer. Évitez les effets de transparence dans le PDF/A-1 (bien que le PDF/A-2 et les versions ultérieures autorisent la transparence). Utilisez des graphiques vectoriels au lieu d'images basse résolution lorsque c'est possible. Assurez-vous que toutes les images sont intégrées plutôt que liées. Définissez la langue du document dans les propriétés du document.

Pour la conformité au niveau A du PDF/A, utilisez des styles de titre appropriés, créez du contenu balisé à l'aide des fonctionnalités de structure de l'application de rédaction, ajoutez du texte alternatif à toutes les images et assurez-vous que les tableaux sont correctement structurés avec des en-têtes. Si le document est complexe, planifiez la structure des balises avant de commencer à créer le contenu. Ajouter l'accessibilité après coup à un document terminé prend considérablement plus de temps que de l'intégrer dès le départ.

Convertir des PDF existants en PDF/A

La conversion de PDF existants au format PDF/A est une exigence courante, en particulier pour les organisations qui numérisent des collections de documents hérités. L'outil Contrôle en amont d'Adobe Acrobat Pro inclut plusieurs profils de conversion PDF/A qui analysent un PDF, identifient les éléments non conformes et tentent de les corriger automatiquement. Le processus de conversion peut intégrer les polices manquantes, convertir les espaces colorimétriques, supprimer le JavaScript et aplatir la transparence.

La conversion automatique fonctionne bien pour les documents simples mais nécessite souvent une intervention manuelle pour les documents complexes. Les problèmes courants empêchant la conversion automatique incluent les polices manquantes (si la police originale ne peut pas être localisée, le convertisseur peut substituer une police différente, altérant l'apparence du document), les couleurs dépendantes du périphérique sans intention de sortie, et le contenu externe référencé qui doit être soit intégré, soit supprimé.

Les outils open source offrent des alternatives pour la conversion par lots. Ghostscript peut convertir des PDF en PDF/A en utilisant des paramètres de périphérique de sortie spécifiques. L'outil VeraPDF valide la conformité PDF/A et fournit des rapports détaillés de non-conformité. LibreOffice peut convertir par lots des documents bureautiques en PDF/A via des scripts en ligne de commande. Pour les projets de conversion à grande échelle, les outils commerciaux comme ABBYY FineReader, Foxit PDF Editor et callas pdfaPilot offrent un traitement par lots avec des rapports détaillés et des taux de réussite plus élevés pour les documents complexes.

Valider la conformité PDF/A

Créer un PDF et sélectionner PDF/A dans les options d'export ne garantit pas la conformité. De nombreux outils de rédaction produisent des fichiers qui prétendent être PDF/A (en incluant les métadonnées appropriées) mais contiennent des éléments non conformes. La validation à l'aide d'un outil dédié est essentielle.

VeraPDF est le validateur open source de référence pour les documents PDF/A. Développé dans le cadre du projet européen PREFORMA, il valide toutes les parties et niveaux de conformité de la norme PDF/A. VeraPDF fournit des rapports détaillés listant chaque violation de conformité, catégorisée par gravité et avec des références à la clause pertinente de la norme ISO. Il peut être utilisé comme application graphique, outil en ligne de commande, ou intégré dans des flux de travail via son API REST.

L'outil Contrôle en amont d'Adobe Acrobat Pro valide également la conformité PDF/A et peut tenter de corriger les problèmes identifiés. Les profils de contrôle en amont pour le PDF/A sont complets et régulièrement mis à jour. callas pdfaPilot offre des capacités de validation et de correction et est largement utilisé dans les flux de travail de production.

Lors de la validation, testez le document au niveau de conformité spécifique que vous visez. Un document qui passe la validation PDF/A-1b peut échouer à la validation PDF/A-1a en raison de balises manquantes. De même, un document conforme au PDF/A-1b peut utiliser des fonctionnalités (comme le JPEG2000 ou la transparence) qui le font échouer au PDF/A-1b mais passer au PDF/A-2b. Établissez une étape de validation dans votre flux de travail de production documentaire pour détecter les problèmes de conformité avant la diffusion ou l'archivage.

Le PDF/A dans des contextes sectoriels spécifiques

Différents secteurs ont adopté le PDF/A de manières spécifiques reflétant leurs besoins de préservation. Dans le secteur juridique, le PDF/A est de plus en plus requis pour les dépôts judiciaires et la conservation des documents. Le système judiciaire fédéral américain (PACER/CM/ECF) accepte les documents PDF/A, et certaines juridictions le rendent obligatoire. Les cabinets d'avocats utilisent le PDF/A pour archiver les dossiers, contrats et correspondances, garantissant que ces documents restent accessibles pendant toute leur durée de conservation, qui peut s'étendre sur des décennies.

Les organisations de santé utilisent le PDF/A pour l'archivage des dossiers médicaux, la documentation des essais cliniques et les soumissions réglementaires. La FDA accepte le PDF/A pour les soumissions électroniques, et de nombreux systèmes de dossiers de santé électroniques (DSE) peuvent exporter des documents au format PDF/A. Les longues exigences de conservation des dossiers médicaux (souvent plus de 10 ans pour les adultes et plus longtemps pour les dossiers pédiatriques) rendent les garanties de préservation du PDF/A particulièrement précieuses.

Les agences gouvernementales sont parmi les plus grands adopteurs du PDF/A. Les Archives nationales américaines (NARA) recommandent le PDF/A comme format préféré pour les documents électroniques permanents. L'Union européenne exige le PDF/A pour les publications officielles et les documents législatifs. De nombreuses bibliothèques et archives nationales dans le monde ont adopté le PDF/A dans le cadre de leurs stratégies de préservation numérique. Les institutions financières utilisent le PDF/A pour la conformité réglementaire, archivant les relevés de transactions, les relevés de compte et la documentation d'audit dans un format que les régulateurs peuvent consulter de manière fiable lors des examens.

Matthias Baertschi
Founder & Lead Engineer

Matthias est le fondateur et l'ingénieur principal de PDF Tools. Il travaille sur le pipeline de traitement PDF dans le navigateur avec pdf-lib et pdfjs-dist, en mettant l'accent sur la confidentialité côté client : les documents sont traités localement et ne sont jamais envoyés sur un serveur. Voir le profil de l'auteur