École des chartes » ELEC » InterPARES 2 » Annexe 21 Principes directeurs à l’usage des services d’archives en charge de la conservation définitive. Préserver des documents numériques : recommandations à l’usage des organisations.

Annexe 21
Principes directeurs à l’usage des services d’archives en charge de la conservation définitive. Préserver des documents numériques : recommandations à l’usage des organisations.

Introduction

Ces principes directeurs ont été élaborés en vue d’apporter des conseils concrets aux services et institutions en charge de la conservation sur le long terme de documents d’archives numériques. Ils ne sauraient prétendre à l’exhaustivité. Ils mettent l’accent sur un certain nombre d’aspects particulièrement importants pour la conservation de documents d’archives numériques authentiques, aspects que les services d’archives, dans leur empressement à accepter des documents numériques, tendent trop souvent à négliger.

Les documents d’archives numériques doivent être gérés avec soin tout au long de leur cycle de vie afin d’en assurer l’accessibilité et la lisibilité au fil du temps et maintenir intacts leur forme, leur contenu et leurs relations pour qu’ils demeurent dignes de confiance en tant que documents d’archives. La gestion des archives numériques nécessite une connaissance approfondie de toutes les phases de leur cycle de vie, depuis leur production et leur maintenance par le producteur jusqu’à leur évaluation archivistique, leur sort final et leur conservation au titre d’archives authentiques des activités et affaires auxquelles elles participent. Du point de vue de la conservation sur le long terme, toutes les activités de gestion des documents d’archives réalisées tout au long de leur cycle de vie sont liées, comme dans une chaîne, et interdépendantes. Qu’un des maillons soit rompu et la chaîne ne fonctionne plus. Si certaines actions et mesures ne sont pas appliquées aux documents d’archives, leur intégrité543 (c’est‑à‑dire leur fiabilité et leur authenticité) et leur préservation sont compromises.

Les présents principes directeurs concernent spécifiquement le maillon « conservation » de la chaîne archivistique et leur articulation est conforme au modèle de chaîne archivistique élaboré par InterPARES (modèle COP, chain of preservation),544, qui décrit les différentes étapes de la production, de la maintenance et de la conservation de documents d’archives authentiques. Les caractères alphanumériques entre parenthèses à la suite de chaque titre de section renvoient à l’activité correspondante dans le modèle de chaîne archivistique.

Ces principes directeurs ont été élaborés pour répondre aux besoins des organisations ou des projets dont les documents d’archives sont appelés à être conservés et consultés pendant de longues périodes et à ceux des institutions archivistiques en charge de la conservation définitive des documents d’archives, dont elles doivent garantir l’authenticité. Dans un cas comme dans l’autre, les ressources humaines et financières ainsi que l’expertise technique disponibles en interne sont souvent limitées.

Nous encourageons les institutions, organisations et programmes assumant des responsabilités de conservation à se reporter aux Principes pour l’élaboration de politiques, de stratégies et de normes pour la conservation sur le long terme des documents d’archives numériques545, élaboré par l’équipe transversale Stratégie et orientations d’InterPARES 2 et complémentaire de ces principes directeurs. Nombre des recommandations formulées ici s’appliquent également à la conservation d’objets numériques autres que les documents d’archives, comme les documents, les publications ou les données.

1. Gérer la chaîne archivistique (A1)

Il s’agit ici d’identifier les besoins et contraintes de l’organisation en matière de conservation et de définir une politique adaptée, qui permettra une gestion appropriée des documents à chaque étape de la chaîne archivistique.

1.1. Définir la portée et les objectifs

Les services d’archives doivent définir le périmètre et les objectifs de leur programme de conservation. Dans le domaine des arts, par exemple, ils souhaiteront peut-être préserver l’enregistrement d’une performance ou opter pour le processus plus complexe consistant à conserver les composants d’une œuvre d’art qui permettront plus tard de la reproduire ou d’en donner de nouvelles représentations. Dans le domaine des sciences, il pourra s’agir de préserver uniquement le rapport final des résultats d’une expérience ou de conserver les données brutes, normalisées ou agrégées afin de documenter la méthodologie utilisée et le résultat obtenu, et d’assurer la disponibilité des données en vue d’utilisations ultérieures. Il revient également aux archivistes de prendre en compte les utilisateurs futurs potentiels des archives. Les utilisateurs qui possèdent des connaissances techniques approfondies ont généralement besoin de moins d’assistance pour accéder à des documents numériques complexes, quand le grand public, lui, aura besoin de mécanismes d’accès conviviaux et de documents convertis dans un nombre limité de formats simples mais largement disponibles. Le programme de conservation aidera le service d’archives à déterminer quelle politique de conservation (voir la section 4 du présent document ainsi que la section B de l’annexe 21c) il pourra être amené à mettre en œuvre.

Nous ne saurions trop encourager les services d’archives à s’appuyer sur les travaux existants. Ils trouveront dans le document Principes... élaboré par InterPARES 2 des recommandations sur les politiques à mettre en œuvre aux niveaux organisationnel, sectoriel, national et international. En ce qui concerne les fonctions du plan de conservation, les archivistes doivent consulter la norme ISO OAIS (Open Archival Information System, Système Ouvert d’Archivage de l’Information)546, et respecter le modèle de chaîne archivistique d’InterPARES 2 pour une adaptation de la norme OAIS aux documents d’archives numériques. Les stratégies doivent également tenir compte de « L’audit et la certification des dépôts numériques de confiance : critères et listes de vérification », version révisée et développée de : « L’audit pour la certification des dépôts numériques de confiance » élaboré par le groupe de travail de la NARA547 et du RLG.548.

1.2. Obtenir des moyens

La pérennisation de l’information numérique requiert des ressources considérables en termes de financement, de capacités technologiques et de compétences. Une organisation ayant à conduire ce type de programme a plusieurs possibilités : a) obtenir de nouvelles ressources ; b) réaffecter des ressources existantes ; c) tirer parti d’autres ressources.

Quelles que soient les options retenues, il est essentiel que les moyens soient durables. Les ressources ponctuelles, comme des subventions par exemple, peuvent être intéressantes pour des tâches précises et limitées, telles que la définition du programme de conservation ou le traitement d’un ensemble donné de documents d’archives, mais tout programme de conservation doit disposer d’un financement durable.

Pour obtenir de nouvelles ressources financières, il convient d’élaborer un projet solide, économiquement viable, et un plan de communication qui saura convaincre les bailleurs de fonds et les parties prenantes que le programme mérite d’être financé. Dans le cas de la création d’un nouveau programme, il sera souvent judicieux de commencer à petite échelle et de s’appuyer sur des réussites à court terme pour convaincre les sources de financement d’accroître progressivement leur participation. Une stratégie progressive doit déterminer si les partenaires sont plus susceptibles d’être influencés par des succès à court terme sur les principaux objectifs du programme ou sur des aspects qui présentent un plus grand intérêt à leurs yeux. Par exemple, ils se laisseront peut-être plus facilement convaincre par une démonstration des capacités technologiques que par un plan d’évaluation archivistique rigoureux et complet des documents d’archives numériques.

Pour la plupart des organisations, il est à craindre que la réaffectation de ressources vers un programme de conservation numérique entraîne des choix douloureux. Ici également, la meilleure solution sera souvent d’opter pour une approche progressive. De plus, il sera possible d’apporter des ajustements au plan au fur et à mesure en se fondant sur l’expérience acquise au cours de chaque phase de la mise en œuvre. Si le programme est destiné à être mis sur pied dans une grande institution, mieux vaut l’inclure dans le plan stratégique global que le traiter comme un projet spécial.

Même lorsque le service d’archives réussit à obtenir de nouvelles ressources ou qu’il est en mesure de réaffecter des ressources existantes à la pérennisation de ses documents numériques, il est peu probable qu’il dispose des ressources suffisantes pour faire face à tous les défis. On ne saurait donc trop encourager les archivistes à essayer de tirer parti de ressources externes. Toutes sortes de possibilités s’offrent à eux. Par exemple, au lieu de chercher à recruter des experts techniques ou de dispenser une formation au personnel sur toutes les connaissances et compétences techniques requises, les archivistes peuvent se tourner vers des experts ou des consultants externes pour des missions ponctuelles. Plus largement, le recours à des partenaires extérieurs est une option qui ne doit jamais être négligée, qu’il s’agisse de services de base ou de missions ponctuelles nécessitant des compétences spécialisées. Par exemple, est-il plus intéressant de faire appel à un prestataire de services informatiques ou d’acquérir un système d’archivage dédié ? On pourra envisager de s’adresser à une société extérieure spécialisée pour des tâches telles que la création de copies à partir de supports numériques obsolètes ou la conversion de formats rares. Une autre option est de s’impliquer dans des communautés open source qui travaillent au développement de méthodes et d’outils pour la pérennisation de l’information numérique (par exemple, FEDORA549 et Global Registry of Digital Formats550).

Enfin, les archivistes d’une organisation qui ne dispose pas des ressources requises pour engager un programme de conservation numérique devraient examiner la possibilité de mettre en place des partenariats ou des consortiums de collaboration pour élaborer et financer un programme présentant des garanties acceptables.

1.3. Mettre l’accent sur les documents d’archives nativement numériques

Il incombe aux services d’archives de s’assurer que les ressources consacrées au programme sont principalement déployées pour protéger les exemplaires des documents d’archives numériques qui font autorité551, et non pour préserver les copies numérisées de documents d’archives analogiques dont on dispose toujours. En effet, la plupart des documents d’archives analogiques survivront même s’ils ne sont pas numérisés, alors que les documents d’archives numériques, eux, disparaîtront si rien n’est fait pour les conserver sur le long terme.

1.4. Apporter des conseils

Le premier maillon de la chaîne de conservation des documents d’archives numériques étant la production, les archivistes doivent donner des conseils sur leur production et leur maintenance. Selon le mandat qui aura été confié au service d’archives, ces conseils pourront par exemple cibler les employés de l’organisation ou, dans le cas d’archives nationales, d’autres institutions ou administrations. Dans d’autres contextes, le message pourra être largement diffusé auprès de telle ou telle communauté ou du grand public, en vue de toucher la ou les personne(s) ou organisation(s) dont les documents d’archives entrent dans le champ du mandat de l’archiviste.

1.5. Prêcher par l’exemple

Les services d’archives doivent créer au sein de leur organisation un environnement de gestion et d’archivage des documents qui leur permettra de produire et de maintenir les documents de contrôle créés dans l’exercice de leur fonction de conservation conformément aux Conditions de référence requises pour étayer la présomption d’authenticité des documents d’archives numériques d’InterPARES 1552. Outre qu’elle s’impose à toute organisation engageant une démarche de conservation sur le long terme, la création de ce type d’environnement apportera également :

  • des « travaux pratiques » aux archivistes dans les technologies qu’ils préconisent aux producteurs des documents ;
  • le « point de vue de l’utilisateur » sur de vraies solutions d’archivage et leur fonctionnement au quotidien ;
  • un banc d’essai permettant d’effectuer des mises à niveau et des innovations, et de les évaluer ;
  • un prototype pouvant être utilisé pour des démonstrations.

1.6. Définir des procédures

Il est impératif que les services d’archives mettent en place des mesures de contrôle pour le transfert, la maintenance et la reproduction des documents d’archives, y compris les procédures et les systèmes pour verser des documents à leur organisation, les maintenir et les reproduire conformément aux Conditions de base requises pour la production de copies authentiques des documents d’archives numériques d’InterPARES 1553. Ces procédures doivent comporter des mesures de contrôle adaptées et efficaces afin de garantir l’identité554 et l’intégrité555 des documents d’archives et, en particulier, d’assurer que :

  • la prise en charge des documents d’archives soit ininterrompue ;
  • des procédures de sécurité et de contrôle soient mises en place et vérifiées périodiquement ;
  • le contenu des documents d’archives ainsi que les additions / mentions et éléments de la forme documentaire requis demeurent intacts après reproduction.

1.7. Mettre en œuvre des politiques de maintenance

On aura beau s’attacher à élaborer des stratégies complexes de conservation sur le long terme, elles seront inapplicables si les documents d’archives qu’elles ciblent ne sont pas correctement maintenus et protégés dans les systèmes de records management et/ou de conservation. On trouvera en annexe 21c, section A, la version complète des huit politiques de maintenance obligatoires, définies comme suit :

A1. la définition précise des responsabilités ;

A2. la mise en place d’une infrastructure technique adaptée ;

A3. la mise en œuvre d’un plan pour la maintenance, le support et le remplacement des systèmes ;

A4. la mise en œuvre d’un plan pour le transfert périodique de documents d’archives sur de nouveaux supports de stockage ;

A5. le respect des choix des supports de stockage et des protocoles de manipulation appropriés pour ces derniers ;

A6. la redondance et la sauvegarde régulière des objets numériques ;

A7. la définition et la mise en place de mesures de sécurité des systèmes ;

A8. la définition et la mise en place d’un plan de prévention et de gestion des sinistres.

2. Évaluer les documents d’archives afin de décider de leur sort final (A4.2)

Lorsque, comme le recommande le modèle de chaîne archivistique d’InterPARES 2, un tableau de gestion est élaboré, la prise de décisions régulières concernant le sort final des documents d’archives fait partie intégrante de la gestion d’un système d'archivage. Dans certains cas, l’évaluation pourra avoir lieu lorsqu’il s’avérera nécessaire de décider du sort final de documents archivés dans un système en place depuis longtemps. Huit aspects importants du processus d’évaluation archivistique sont abordés ci-dessous.

2.1. Évaluer les documents dès le début

Compte tenu des difficultés techniques que pose la conservation des documents d’archives numériques, il faut identifier le plus tôt possible les documents à conserver sur le long terme. Impliquer le producteur dans le dispositif est un gage supplémentaire de réussite. On pourra par exemple le solliciter pour l’évaluation des documents, le choix des méthodes de versement ou même la définition de politiques de conservation. Ce processus peut également être l’occasion pour l’archiviste de donner des conseils sur la production et la maintenance des documents d’archives (voir la section 1.4).

Les professionnels des archives sont souvent invités à participer à la conception des applications informatiques développées par les organisations dont ils prennent en charge les documents. Cette approche facilite l’intégration des bonnes pratiques d’archivage et de conservation. Les archivistes ayant expérimenté ce type de collaboration ont pu découvrir que celle-ci était très consommatrice de temps et exigeait une connaissance beaucoup plus approfondie des flux de travail et des procédures internes de l’organisation que celles qu’ils acquièrent normalement au cours d’une évaluation archivistique. Qui plus est, les spécifications des systèmes donnent rarement une image exacte de l’application qui sera finalement mise en place. Il sera ainsi indispensable de conduire également une évaluation archivistique des documents une fois que le système sera opérationnel et conforme aux exigences de l’organisation. Les services d’archives auront peut-être plutôt intérêt à accompagner la conception du système au titre de consultants (voir la section 1.4). Le partage de politiques, principes et méthodes de haut niveau élaborés au sein de la profession archivistique peut s’avérer un objectif plus réaliste556.

2.2. Repérer les propriétaires multiples

Lorsqu’un objet numérique a plusieurs propriétaires, ces derniers doivent être identifiés pendant le processus d’évaluation archivistique afin de savoir quelles incidences cela peut avoir pour la conservation. C’est par exemple le cas lorsque diverses administrations mettent des données en commun et en partagent l’accès. Les sites web qui accèdent à et utilisent des ressources ne faisant pas partie de leur sphère de contrôle en offrent un autre exemple. Bien que, dans ce type de contexte, l’accès aux données fasse l’objet d’accords négociés, ceux-ci comportent rarement des dispositions relatives à la conservation sur le long terme de tous les composants numériques importants.

2.3. Évaluer l’authenticité des documents

L’évaluation de l’authenticité a toujours fait partie intégrante du processus d’évaluation archivistique. Elle a d’abord consisté à vérifier que la chaîne de conservation des documents avait été maintenue sans interruption, depuis leur production jusqu’à leur versement au service d’archives en charge de leur conservation définitive. Les périodes au cours desquelles les documents d’archives n’ont fait l’objet d’aucune mesure de protection de la part de leur producteur, ou d’une institution lui ayant succédé et ayant intérêt à maintenir leur exactitude et leur complétude, font peser un doute important sur l’authenticité des documents d’archives.

L’évaluation de l’authenticité était également fondée sur les connaissances de l’archiviste, tant sur le plan historique que par rapport aux types de documents d’archives et aux procédures administratives d’un producteur donné. Le cadre général de cette évaluation a été codifié à l’origine par la diplomatique557. Une troisième méthode, plus rarement utilisée, de vérification de l’identité et de l’intégrité des documents d’archives, repose sur la comparaison. Les documents d’archives d’un fonds sont comparés à des copies transmises à des sources extérieures et détenues par celles-ci dans le cours normal des activités du producteur.

Les documents d’archives produits et maintenus à l’aide de la technologie numérique engendrent des difficultés supplémentaires, et les services d’archives n’ont pas encore mis au point de pratiques normalisées pour évaluer leur authenticité dans ce type d’environnement. Pour l’essentiel, ces difficultés tiennent au fait qu’il est très facile de copier, distribuer, renommer, reformater ou convertir ces objets numériques et de les falsifier sans laisser la moindre trace. Les quelques exemples ci-dessous illustrent l’ampleur des pertes pour les archivistes, les historiens, les avocats et tous ceux qui ont besoin de documents d’archives authentiques dans le cadre de leur travail :

  • le support sur lequel les documents numériques sont stockés n’a quasiment plus aucune utilité pour confirmer la date d’un document d’archives ou son lieu de production. Quiconque a accès à un équipement et à un support de stockage obsolètes, mais toujours en fonctionnement, peut copier des fichiers numériques, par exemple sur des bandes neuf pistes ou des disquettes ;
  • la date d’un fichier numérique peut être modifiée en ajustant l’horloge système ;
  • peu d’institutions avaient envisagé ce que feraient leurs collaborateurs une fois équipés de logiciels de traitement de texte. Les formes standards de document, comme les notes de service et la correspondance sur papier à en-tête, ont disparu sous l’assaut de nouvelles formes de documents individualisées, qui ont rapidement permis la personnalisation des couleurs, des éléments graphiques et même des effets sonores, ainsi que l’attribution de nouvelles significations aux majuscules et aux couleurs et l’élaboration de smileys. La désaffection pour les pratiques normalisées de production de documents d’archives a été très variable selon le type et la taille des entreprises et des administrations ;
  • avec la mise en place des réseaux de messagerie électronique, la circulation des documents d’archives entre collaborateurs a commencé à emprunter de nouvelles voies, au détriment des circuits de diffusion classiques balisés par les procédures internes traditionnelles ;
  • les fortes réductions du personnel en charge de la gestion des documents d’archives dans la plupart des organisations, alimentées par l’idée que les objets numériques n’avaient pas besoin d’être gérés, ont eu des répercussions négatives sur les fonds des services d’archives qui ne reçoivent quasiment plus de documents d’archives produits et versés sous forme numérique.

Lors de l’évaluation archivistique de documents créés dans un environnement numérique, l’évaluation de leur authenticité doit devenir un processus plus visible et plus transparent, conduit et documenté par l’archiviste. Une chaîne de conservation ininterrompue, la connaissance des pratiques d’archivage et leur vérification peuvent également être considérées comme des indices de l’authenticité des documents. Il convient désormais de vérifier également que les pratiques sont bien conformes aux Conditions de référence requises pour étayer la présomption d’authenticité, qui sont énumérées à la section 2.4 ci-dessous.

2.4. Documenter l’évaluation de l’authenticité

Le rapport d’évaluation archivistique doit décrire les mesures de contrôle mises en place par le producteur pour garantir l’identité et l’intégrité de ses documents et, partant, la présomption de leur authenticité. Ces mesures renvoient à chacune des conditions de référence requises pour étayer la présomption d’authenticité558. À savoir :

A.1 l'indication des attributs du document et du lien au document (par exemple, les métadonnées d’identification et d’intégrité) ;

A.2 les droits d’accès ;

A.3 les procédures de protection contre la perte et la corruption des documents ;

A.4 les procédures de protection contre la détérioration du support de stockage et les changements technologiques ;

A.5 la définition de la forme des documents ;

A.6 l’authentification des documents ;

A.7 l’identification du document qui fait autorité ;

A.8 le versement de la documentation pertinente.

2.5. Contrôler périodiquement les documents d’archives à conserver sur le long terme

Une fois l’évaluation archivistique terminée, les documents d’archives destinés à être conservés sur le long terme doivent faire l’objet d’un contrôle périodique jusqu’à ce qu’ils soient versés à l’institution en charge de leur conservation. Il s’agira en particulier de vérifier auprès du producteur que rien n’a changé dans la façon de produire et de maintenir les catégories de documents d’archives à transférer ou, si des changements sont survenus, qu’ils n’ont pas eu d’incidences sur la nature et les attributs des documents, leur valeur, leur authenticité ou leur conservation.

Nombreux sont les changements au sein d’une organisation qui peuvent avoir un effet négatif sur la survie des documents d’archives numériques. Le risque qu’ils soient détruits en un instant est bien plus élevé que pour les documents papier. Ce risque est plus ou moins contrebalancé par la tendance générale à reproduire les documents de manière anarchique. Malheureusement, si la production de copies n’est pas contrôlée, il est peu probable que quiconque se rende compte que le dernier exemplaire d’un document d’archives a été détruit.

Prenons l’exemple d’une simple mise à niveau du système, soit du matériel soit des logiciels. Elle aura une incidence sur la capacité du service d’archives à accepter les documents. Une mise à niveau peut également se traduire par une restructuration mineure du système, susceptible de rendre impossible la séparation des documents d’archives devant être conservés à court terme de ceux qui doivent être sortis du système pour être versés au service d’archives en charge de leur conservation définitive.

Autre type de scénario envisageable, la mission ou les fonctions d’une organisation peuvent évoluer. Et avec elles, la façon dont sont utilisées les applications informatiques, ainsi que la nature et le volume des données qu’elles contiennent. Il est possible que les personnes chargées de modifier le système ne sachent pas que les documents d’archives existants doivent être transférés au service d’archives responsable avant toute modification du système. Si personne n’intervient, même la documentation de l’application originale et les copies de sauvegarde sont condamnées à plus ou moins brève échéance à être détruites.

Enfin, en raison du recul patent des bonnes pratiques de gestion et d’archivage des documents d’archives dans la plupart des organisations, les documents sont mal identifiés et stockés dans de mauvaises conditions et dans des locaux où ils ne sont pas en sécurité. Les managers, y compris les responsables archives, ne maîtrisent pas nécessairement les détails de l’infrastructure technique, quand le personnel informatique, lui, ne connaît pas toujours l’histoire de l’organisation ni l’importance des documents d’archives plus anciens des divers lieux de stockage. Effacement du contenu des disques durs, suppression de comptes utilisateurs et des fichiers qu’ils contiennent, recyclage ou destruction des bandes et des disques, mise au rebut des technologies de lecture obsolètes pour répondre aux exigences opérationnelles quotidiennes de vitesse et d’efficacité : autant de décisions qui peuvent être prises sans que leurs auteurs aient toujours conscience de leur impact sur les documents d’archives de l’organisation ou les accords de versement déjà conclus afin de garantir leur conservation sur le long terme.

2.6. Actualiser l’évaluation archivistique

Les évaluations archivistiques doivent également être mises à jour à intervalles réguliers, moins fréquemment toutefois que le contrôle périodique des documents d’archives destinés à être transférés. Les renseignements recueillis à l’occasion d’un de ces contrôles peuvent faire apparaître la nécessité de conduire une nouvelle évaluation. Les organisations, leurs systèmes de gestion et d’archivage des documents évoluent, c’est inévitable. Les missions et les responsabilités des organisations peuvent, elles aussi, changer, tout comme la manière de les exercer. Les données accumulées dans les systèmes peuvent connaître de nouveaux usages, susceptibles d’augmenter leur valeur à long terme. Des systèmes qui, à l’origine, ne contenaient pas de documents d’archives peuvent être mis à niveau en vue de leur donner la capacité de le faire. C’est particulièrement vrai des systèmes d’archivage « hybrides » actuels, où les systèmes papier traditionnels coexistent avec des systèmes d’information, de gestion des documents ou d’archivage électroniques.

2.7. Identifier tous les composants numériques559

Les documents d’archives papier conservés dans les systèmes traditionnels le sont généralement dans des boîtes ou des dossiers conçus à cet effet, où le contenu du document est inextricablement lié à son support papier et où le document lui-même est classé dans le respect de son contexte, avec les documents qui lui sont liés. Ce système a commencé à perdre de sa belle unité avec l’irruption de la technologie, lorsque, par exemple, il a fallu traiter les négatifs des photographies en vue d’en faire des tirages ou encore avec les images en mouvement, produits de multiples couches de son et d’images, combinées et recombinées pour produire la copie standard définitive projetée dans les cinémas ou diffusée à la télévision.

Avec la technologie numérique, le morcellement du document d’archives en composants s’est encore accru. Pour réussir à extraire un document d’archives numérique du système dans lequel il a été produit ou même d’un site secondaire, l’archiviste doit s’assurer préalablement au transfert du document que tous les composants numériques essentiels sont identifiés et que les relations implicites qui existent entre eux sont exprimées de manière explicite dans les métadonnées. Un des exemples les plus courants de composant numérique est la bibliothèque de polices de caractères dans laquelle le producteur peut choisir autant de polices qu’il lui plaira lors de la création d’un document en traitement de texte. Sous Windows, les polices de caractères sont stockées dans des fichiers .dll (ou bibliothèques de liens dynamiques). Pour que l’archiviste puisse reproduire ce document d’archives tout en respectant les intentions originales du producteur, le composant numérique qui contient le texte et celui qui contient la police de caractères doivent tous deux être archivés, de même que le lien établi entre eux, défini de telle sorte que le logiciel qui cherchera à afficher le contenu du fichier texte trouve la bonne bibliothèque de polices560.

2.8. Conduire une étude de faisabilité

Le processus d’évaluation archivistique doit être complété par une étude rigoureuse des impératifs techniques relatifs à la conservation bien que celle-ci ne fasse pas partie de l’évaluation de la valeur des documents d’archives. Différentes politiques de conservation sont envisageables (voir la section B de l’annexe 21c), pour un coût et des résultats très différents eux aussi. Un document d’archives textuel dépouillé de sa mise en forme peut être acceptable lorsque l’archiviste souhaite seulement garder le contenu du document. Cependant, lorsque la forme et les caractéristiques d’affichage du document véhiculent du sens, il faudra opter pour une solution de conservation plus sophistiquée.

L’étude de faisabilité est essentielle pour que l’institution en charge de la conservation connaisse précisément le coût de la prise en charge et de la conservation dans lesquelles elle s’engage. Cette démarche n’est pas nouvelle ; il s’agit tout bonnement de l’extension au domaine numérique de l’évaluation des ressources nécessaires pour conserver, par exemple, des documents d’archives papier moisis ou de la pellicule racornie. À ce jour toutefois, la pérennisation de l’information électronique étant ce qu’elle est, les coûts de conservation doivent être considérés comme des dépenses récurrentes. Il faudra copier les fonds et collections d’un support sur un autre chaque fois que le format choisi sera devenu obsolète et convertir les formats de fichiers lorsque l’obsolescence logique risquera de rendre le contenu illisible. Parfois, les documents d’archives numériques que l’on envisage de préserver sur le long terme pourront exiger des mesures trop complexes pour l’environnement technologique et les connaissances de l’organisation chargée de leur conservation, ce qui pourra conduire à en reporter le versement.

3. Prendre en charge les documents d’archives retenus pour une conservation définitive (A4.3)

La prise en charge des documents d’archives par l’archiviste et toutes les activités de conservation qui en découlent ont pour but de garantir l’authenticité et l’accessibilité dans le temps de ces documents sélectionnés pour être conservés sur le long terme. Le transfert des documents de la responsabilité du producteur (ou de son successeur légitime) à celle du service d’archives est une étape de la chaîne archivistique aussi essentielle que délicate, qui devra donc être conduite avec le plus grand soin afin d’assurer le bon déroulement du transfert.

3.1. Élaborer conjointement un plan pour le versement

Pour que le versement des documents de leur détenteur actuel (qu’il s’agisse de leur producteur ou de son successeur légitime) à l’organisation ou au programme en charge de leur conservation s’effectue dans de bonnes conditions, les deux parties doivent au préalable convenir d’une feuille de route. Accéder à nouveau à des systèmes obsolètes ou extraire des documents des systèmes en place entraînera nécessairement des coûts en ressources humaines pour le temps de copie et, vraisemblablement, le temps de programmation. Il est également possible que du matériel informatique et des logiciels spéciaux soient nécessaires. Il est impératif que les deux parties s’entendent sur les formats logiques et physiques (ou virtuels) utilisés pour le transfert. En règle générale, le plan de versement devra être élaboré lors de la réalisation de l’étude de faisabilité technique pour la prise en charge et la conservation. Si les deux parties ne parviennent pas à s’entendre sur le processus de versement, il faudra peut-être revoir la décision prise dans le cadre de l’évaluation archivistique. Encore une fois, à l’heure où coexistent des pratiques hybrides d’archivage, les options reposant sur l’utilisation du support papier et du microfilm peuvent demeurer envisageables. Le service d’archives pourra aussi encourager le producteur à effectuer des mises à niveau de son système qui faciliteront les versements réguliers.

3.2. Mettre en application des procédures normalisées

Les mesures de contrôle sur le versement des documents d’archives numériques de la responsabilité du producteur à celle du service d’archives doivent comprendre :

  • la définition, la mise en œuvre et le contrôle périodique de procédures d’enregistrement des versements de documents ;
  • la vérification de l’autorisation du versement ;
  • l’examen des documents pour déterminer s’il s’agit bien des documents d’archives à verser ;
  • l’enregistrement des documents.

Dans le cadre du processus de versement, l’authenticité des documents d’archives du producteur, qui a été évaluée lors du processus d’évaluation archivistique, doit être vérifiée. Il conviendra de vérifier que les métadonnées d’identification et d’intégrité des documents ont bien été transférées avec les documents auxquels elles se rapportent, qu’elles leur sont liées, et que les documents sont bien accompagnés de toute la documentation utile concernant l’environnement technique et administratif dans lequel ils ont été produits et maintenus.

3.3. Garder le plus ancien format logique disponible

Le service d’archives doit, chaque fois que possible, maintenir le format logique561 dans lequel les documents d’archives ont été créés ou dans lequel ils sont détenus par le producteur au moment du versement, en plus des copies de conservation ou de consultation produites après le transfert. Si les politiques de conservation retenues, comme telle ou telle méthode de conversion par exemple, s’avéraient par la suite défaillantes, la conservation ininterrompue du format logique initial permettrait à l’archiviste de reprendre le processus de conservation depuis le début, à partir de l'exemplaire du document d’archives qui fait autorité, en mettant en œuvre une politique de conservation différente. Au cours des longues périodes durant lesquelles les services d’archives détiennent les documents, il se peut que d’autres politiques de conservation se révèlent plus stables ou plus faciles à mettre en œuvre sur le long terme. De nouvelles méthodes de conservation peuvent aussi voir le jour après la prise en charge et le traitement initial des documents.

3.4. Éviter les doublons

Compte tenu de la facilité avec laquelle les documents d’archives numériques peuvent être reproduits, le service d’archives doit mettre en place des procédures afin de garantir que les documents d’une série donnée ne lui soient transférés qu’une seule fois par un producteur donné. Afin d’éviter de refaire deux fois la même chose, veiller à l’exactitude des données d’identification est une première étape importante. De plus, si le service d’archives fournit des copies de consultation au producteur après le versement des documents, celles-ci devront être clairement identifiées et désignées comme telles afin d’éviter qu’elles ne soient accidentellement transférées à nouveau.

3.5. Documenter toutes les activités de traitement

Les traitements initiaux appliqués pendant et immédiatement après le versement ne sont pas nécessairement liés à la conservation en tant que telle. La vérification de l’identité des documents versés, la détection de virus et la vérification de la complétude des fichiers n’ont généralement pas d’incidence sur les fichiers. En revanche, la conversion de fichiers, le changement du nom d’un objet numérique ou encore l’encapsulation de fichiers sont des opérations beaucoup moins neutres. Dans les deux cas, les services d’archives doivent documenter toutes les activités de traitement appliquées aux documents d’archives numériques, ainsi que leurs effets, pendant qu’ils sont sous leur responsabilité (voir la condition B.2 de l’annexe 21b). Cette documentation devra notamment indiquer :

  • la raison pour laquelle certains traitements ont été appliqués aux documents ;
  • quels documents d’archives ont été traités ;
  • la date à laquelle le traitement a été effectué ;
  • le nom des personnes qui ont réalisé et documenté les diverses étapes des traitements ;
  • les incidences du traitement sur la forme, le contenu, l’accessibilité et l’utilisation des documents ;
  • la description des dommages, pertes ou autres problèmes résultant du traitement, y compris tout effet sur les éléments relatifs à l’identité et l’intégrité des documents.

Si l’archiviste produit des copies des documents pris en charge, il ne doit pas oublier que ces copies doivent, comme le précise la section 1.5, être produites dans un environnement conforme aux exigences applicables562 énoncées dans les Conditions requises pour évaluer et maintenir l’authenticité des documents d’archives numériques d’InterPARES 1.

4. Conserver les documents d’archives versés (A4.4)

Le service d’archives désigné est l’entité responsable juridiquement de la prise en charge et de la conservation (c’est-à-dire, chargé d’assurer la protection et l’accès continu aux documents) des archives d’un producteur. Qu’il s’agisse d’une organisation externe ou d’un service interne, son rôle est celui d’un archiviste tiers de confiance563. Les copies des documents d’archives du producteur sont conservées par l’archiviste tiers de confiance dans un système d’archivage digne de confiance (voir l’annexe 21c), qui doit comporter un système de description et d’extraction. Ce système doit être assorti de règles et de procédures pour la production de copies authentiques lorsque le système existant sera obsolète et que la technologie sera mise à niveau.

4.1. Décrire les documents d’archives

Les informations sur les documents d’archives et leurs contextes recueillies au cours de l’évaluation archivistique et du traitement doivent être consignées dans la description archivistique du fonds ou de la série auquel appartiennent les documents (voir la condition B.3 de l’annexe 21b). Doivent également y figurer les informations concernant les droits de propriété intellectuelle et la protection des données à caractère personnel.

La description archivistique du fonds ou de la série contenant les documents d’archives numériques doit comprendre, outre les informations sur les contextes juridico-administratif, procédural, documentaire et de provenance, tous les renseignements concernant les modifications apportées aux documents d’archives numériques du producteur depuis leur production. La description doit également comporter une présentation des processus de versement et de conservation utilisés, basée sur la documentation mentionnée à la section 3.5, et expliquer les relations entre les composants numériques abordées à la section 2.7.

4.2. Déterminer les conséquences juridiques des mesures de conservation

Le choix d’une politique de conservation doit prendre en compte ses implications juridiques. Par exemple, la conversion d’un format à partir d’un environnement propriétaire peut exposer le service d’archives à des actions illégales. Aux États-Unis par exemple, la production d’outils susceptibles de contrevenir aux mesures de protection du droit d’auteur constitue une infraction criminelle en vertu du Digital Millenium Copyright Act. Au niveau international, le traité sur le droit d’auteur de l’Organisation mondiale de la propriété intellectuelle (OMPI) contient des dispositions sur la protection du droit d’auteur pour les logiciels et les œuvres numériques, et prévoit des sanctions pénales en cas de violation de celui-ci, depuis la reproduction non autorisée de contenus publiés sur un site web jusqu’à la suppression ou l’altération des mesures techniques de protection associées aux œuvres numériques. La plupart des logiciels comportent également des restrictions du même ordre que les utilisateurs doivent accepter lorsqu’ils les installent sur leur ordinateur.

4.3. Confirmer l’efficacité de la politique de conservation retenue

Comme le précise la section 2.8, différentes stratégies de conservation sont désormais disponibles. Dans l’idéal, l’option retenue devra être testée sur les documents d’archives avant le versement officiel au service d’archives pour s’assurer qu’elle donne les résultats attendus. Dans la réalité, la majorité des organisations ou programmes de conservation ne peuvent financer ce type de tests qu’à titre exceptionnel. Tout comme il convient de vérifier avec soin les traitements envisagés avant de les appliquer en masse aux documents d’archives analogiques, les services d’archives en charge de documents numériques doivent être extrêmement vigilants sur les incidences potentielles de tout processus de conservation sur les documents d’archives et s’assurer qu’il convient à la conservation de documents d’archives authentiques. Des défauts dans les logiciels et l’évolution des fonctionnalités des versions au fil du temps peuvent avoir des conséquences imprévues lorsqu’on les utilise avec un nouveau groupe de documents.

Ce processus nécessite notamment de contrôler régulièrement la présence et la performance de tous les composants numériques. La modification d’un composant peut avoir des effets inattendus sur un autre composant ou une incidence sur le fonctionnement de la relation entre deux composants essentiels du document ou leur capacité d’interagir. Un autre exemple de relation susceptible d’être touchée est celle qui existe entre les éléments d’un groupe de documents d’archives apparentés, comme un dossier ou une série par exemple, et la présentation de cet ensemble dans le bon ordre (alphabétique, chronologique ou hiérarchique, par exemple). Si l’ordre initial a été perdu, il faudra prendre des mesures correctives.

4.4. Maintenir des conditions de stockage appropriées

Dans le domaine de la conservation des archives, il est largement admis qu’assurer aux documents des conditions de stockage (température et humidité relative) adéquates et uniformes est la manière la plus rentable de contribuer à leur conservation sur le long terme. Les fabricants de supports de stockage magnétiques ou optiques offrent généralement des conseils sur les conditions optimales de stockage. Il faut contrôler en permanence l’environnement et vérifier régulièrement les indicateurs. Cette recommandation est l’une des huit stratégies de maintenance obligatoires énumérées dans la section 1.7 et présentées en détail dans la section A de l’annexe 21c.

5. Communiquer les documents d’archives (A4.5)

Comme cela a déjà été mentionné, l’accessibilité (c’est-à-dire, l’utilisation) des documents fait partie intégrante du processus de conservation. Donner accès aux documents est donc un élément fondamental de la chaîne archivistique. Il doit être géré par le service d’archives avec le même sens des responsabilités et le même degré de compétence technique et professionnelle que l’évaluation, la prise en charge, le versement, la description et le stockage des documents d’archives.

5.1. Expliquer la méthode de production des copies de consultation

Il convient de fournir aux utilisateurs une description précise et facilement accessible de la relation entre les documents d’archives pris en charge auprès du producteur et les copies produites par le service d’archives (voir la condition B.2.b de l’annexe 21b). Il faut également expliquer comment les mesures de contrôle du processus de reproduction utilisé ont été établies et mises en œuvre et quelle est la méthode utilisée pour leur surveillance afin de garantir que le contenu des documents d’archives reproduits demeure inchangé pendant la reproduction. Il se peut que les copies des documents d’archives conservées dans le système d'archivage ne soient pas considérées comme authentiques si l’archiviste les a produites à des fins autres que la conservation. On peut par exemple produire une copie de consultation d’où auront été supprimées les données nominatives.

Documenter les processus de reproduction des documents d’archives et leurs effets est un moyen essentiel de démontrer leur transparence (c’est-à-dire, qu’ils sont dépourvus de toute intention de tromperie ou de manipulation). Cette transparence est nécessaire pour que le service d’archives joue pleinement son rôle d’archiviste tiers de confiance des documents d’archives. Elle permet également aux utilisateurs de disposer d’un outil crucial d’évaluation et d’interprétation des documents d’archives en attestant leur authenticité et en en donnant un historique complet, dont l’historique de la reproduction constitue un aspect essentiel.

5.2. Fournir aux utilisateurs les informations techniques nécessaires

Comme le précise la section 1.1, différents services d’archives fournissent des services de consultation à différents types d’utilisateurs. Cela aura une influence sur les formats et systèmes de consultation adoptés par l’organisation ou le programme de conservation, les méthodes simples étant à privilégier pour le grand public qui ne possède pas forcément des ordinateurs ou qui ne dispose que d’un appareil très simple doté de quelques logiciels courants. Pour répondre aux besoins de ces utilisateurs, le service d’archives pourra être amené à procéder à des traitements supplémentaires ou à créer des outils spécialisés pour aider les chercheurs. Les utilisateurs plus pointus, comme par exemple les statisticiens qui analysent des données, sont plus susceptibles d’utiliser leurs propres outils logiciels sur les copies des documents d’archives.

Conclusion

Ce document propose un certain nombre de mesures et de méthodes à l’usage des institutions, des organisations et des programmes en charge de la conservation de documents d’archives numériques pouvant être présumés authentiques et exacts lorsqu’ils sont sous la responsabilité du service d’archives. Pour les particuliers et les petites organisations, la tâche peut sembler bien lourde, mais ne rien faire c’est prendre le risque de perdre des documents d’archives ou d’être confronté à des documents corrompus ou à l’authenticité contestable, avec des conséquences bien plus graves à long terme. Les petites structures auront tout intérêt à désigner officiellement la ou les personnes chargées de superviser la conservation de leurs archives numériques. Il ne faut cependant pas perdre de vue qu’il n’est pas toujours nécessaire de mettre systématiquement en œuvre toutes les recommandations formulées dans le présent document. Il appartient à chaque service d’archives de sélectionner et d’adopter les mesures les plus pertinentes en fonction des problèmes particuliers qu’il rencontre dans son contexte de travail. Dans certains cas, il est possible que des mesures supplémentaires soient requises en raison d’exigences législatives ou réglementaires propres au champ de compétence du service d’archives. Dans ces cas, il pourra s’avérer nécessaire de se tourner vers des experts juridiques. D’une manière générale, nous ne pouvons qu’encourager les particuliers, les services et les petites organisations à prendre contact avec ces spécialistes pour toute question relative à la conservation des documents d’archives numériques placés sous leur responsabilité et leur contrôle.


543 NdT : on remarquera ici que l’auteur ne reprend pas la définition de l'intégrité telle qu’elle est donnée dans les autres rapports et annexes ou dans le glossaire.
545 Voir l’annexe 19, « Principes pour l’élaboration de politiques, de stratégies et de normes pour la conservation sur le long terme des documents d’archives numériques ».
546 International Organization for Standardization, ISO 14721 : 2003 – Space data and information transfer systems – Open archival information system – Reference model. Le texte français de la norme OAIS (version 1.0, traduction française de 2005) est disponible sur le site des Archives de France : http://www.archivesdefrance.culture.gouv.fr/gerer/archives-electroniques/standard/norme-oais-iso-14721/. Voir également la norme ISO 16363 : 2012 : « Systèmes de transfert des informations et données spatiales – Audit et certification des référentiels numériques de confiance ».
547 National archives and records administration (USA) et Research Librairies Group.
548 Voir Online Computer Library Center, Center for research Libraries (2007), « Trustworthy Repositories Audit & Certification : Criteria and Checklist », v. 1.0., février 2007, https://www.crl.edu/sites/default/files/d6/attachments/pages/trac_0.pdf.
551 Un exemplaire faisant autorité est « l’exemplaire d’un document d’archives considéré par le producteur comme son document de référence et généralement soumis à des contrôles procéduraux qui ne sont pas requis pour d’autres exemplaires. » (glossaire français. Pour aller plus loin, voir InterPARES 2 Terminology Database, http://www.interpares.org/ip2/ip2_terminology_db.cfm).
552 Voir Authenticity Task Force (2002), « Appendix 2 : Requirements for Assessing and Maintaining the Authenticity of Electronic Records », in The Long-term Preservation of Authentic Electronic Records : Findings of the InterPARES Project, Luciana Duranti, éd. (San Miniato, Italie : Archilab, 2005). Une version en ligne est disponible à l’adresse suivante : http://www.interpares.org/book/interpares_book_k_app02.pdf. Voir l’annexe 21a pour une version abrégée.
553 Ibid. Voir l’annexe 21b pour une version abrégée.
554 Identité : ensemble des attributs d’un document ou d’un document d’archives qui l’identifient et le distinguent de manière unique de tout autre document ou document d’archives. Avec l’intégrité, un des composants de l’authenticité. (glossaire français. Pour aller plus loin, voir InterPARES 2 Terminology Database, op. cit.).
555 Intégrité : qualité de ce qui est complet et inchangé dans ses aspects essentiels. Avec l’identité, un des composants de l’authenticité. (glossaire français. Pour aller plus loin, voir InterPARES 2 Terminology Database, op. cit.).
556 De nombreux aspects concernant la création de programmes performants de pérennisation de l’information numérique ont été étudiés au cours des dernières années. Parmi les sites web contenant des informations utiles ou des exemples, on citera : le projet InterPARES à l’adresse http://www.interpares.org ; Model Requirements for the Management of Electronic Records (MoReq) à l’adresse http://www.cornwell.co.uk/edrm/moreq.asp et également sur le site des Archives de France : http://www.archivesdefrance.culture.gouv.fr/gerer/archives-electroniques/standard/moreq2 ; Metadata Encoding and Transmission Standard (METS) à l’adresse http://www.loc.gov/standards/mets/ ; Electronic Records from Office System (EROS) aux Archives nationales du Royaume-Uni, à l’adresse http://www.nationalarchives.gov.uk/electronicrecords/advice/guidelines.htm ; et le manuel du projet australien DIRKS (Designing and Implementing Recordkeeping Systems), à l’adresse https://www.records.nsw.gov.au/recordkeeping/documents/recordkeeping-dirks/DIRKS%20Manual.pdf.
557 À ce sujet, voir l’article de Luciana Duranti et Kenetth Thibodeau (2006), « The Concept of Record in Interactive, Experiential and Dynamic Environments : the View of InterPARES, » Archival Science 6(1) : 15-21. Pour la traduction française, voir l’annexe 2, « Le concept de document d’archives dans les environnements interactifs, expérientiels et dynamiques : le point de vue d’InterPARES ».
558 Voir l’annexe 21a.
559 Composant numérique : objet numérique faisant partie d’un ou plusieurs documents numériques, y compris les métadonnées nécessaires pour classer, structurer ou représenter son contenu et sa forme, requérant une action de conservation donnée. (glossaire français. Pour aller plus loin, voir InterPARES 2 Terminology Database, op. cit.)
560 Pour une description et une discussion plus approfondies du concept de « composant numérique », voir Preservation Task Force (2001), « Appendix 6 : How to Preserve Authentic Records », in Duranti, Long-term Preservation, op. cit., 293-328. Une version en ligne est également disponible à l’adresse : http://www.interpares.org/book/interpares_book_o_app06.pdf.
561 Format logique : organisation des données sur un support garantissant que les structures de contrôle des fichiers et des données sont reconnues et peuvent être récupérées par le système d’exploitation de l’ordinateur hôte. (glossaire français. Pour aller plus loin, voir InterPARES 2 Terminology Database, op. cit.). À titre d’exemples de formats de fichiers et de répertoires, on peut citer l’ISO 9660/13490 pour les CD et l’Universal Disk Format (UDF) pour les DVD.
562 La condition A5 (Identification de la forme documentaire), selon laquelle le producteur doit définir la forme du document, ne s’applique généralement pas aux services d’archives sauf dans les cas où la forme initiale du document d’archives a été perdue et où le service d’archives doit la remplacer pour permettre l’accès au document.
563 Archiviste tiers de confiance : entité en charge des documents d’archives pouvant démontrer qu’elle n’a pas de raison de modifier les documents conservés ou d’autoriser d’autres à le faire, et qu’elle est capable de mettre en œuvre toutes les conditions requises pour la conservation de copies authentiques de ces documents. (glossaire français. Pour aller plus loin, voir InterPARES 2 Terminology Database, op. cit.) .