Annexe 19
Principes pour l’élaboration de politiques, de stratégies et de normes pour la conservation sur le long terme des documents d’archives numériques489
Introduction
Les projets de recherche InterPARES ont étudié la production, la maintenance et la conservation des documents d’archives numériques. Une conclusion majeure de ces travaux est que, pour préserver des documents d’archives numériques qui soient dignes de confiance (c’est-à-dire, des documents d’archives dont la fiabilité, l’exactitude et l’authenticité puissent être démontrées), certaines conditions doivent présider à leur production ; en d’autres termes, les producteurs doivent créer les documents de telle sorte qu’il soit possible de les maintenir et de les conserver. Une relation entre le producteur des documents490 et le service d’archives491 qui les prendra en charge doit donc être initiée dès le moment où les documents d’archives sont produits492.
Les travaux du projet InterPARES 1 (1999-2001) ont adopté le point de vue du service en charge de la conservation des documents. Trois enseignements majeurs en ont été tirés : 1) tout environnement d’archivage ayant pour but de produire des documents d’archives numériques fiables et exacts et de maintenir des documents d’archives authentiques493 doit répondre à un certain nombre de caractéristiques (conditions requises) ; 2) il n’est pas possible de conserver des documents d’archives numériques ; seule peut être conservée la capacité de les reproduire494 ; et 3) le service en charge de la conservation doit être impliqué dès le début du cycle de vie des documents pour être en mesure d’affirmer que les copies qui seront retenues pour la conservation définitive sont bien des copies authentiques des documents d’archives du producteur.
Les travaux d’InterPARES 2 (2002-2006) ont adopté le point de vue du producteur des documents. Les chercheurs ont réalisé des études de cas sur la production et la maintenance des documents d’archives dans le secteur des arts, le secteur scientifique et l’administration ; ils ont modélisé les nombreuses fonctions que recouvrent la production, la maintenance et la conservation des documents d’archives en s’appuyant sur le modèle du cycle de vie du document d’archives et sur celui du records continuum ; ils ont étudié et comparé les législations et les politiques publiques de plusieurs pays et à différents échelons, du national au municipal ; ils ont analysé de nombreux formats de métadonnées et élaboré un outil pour identifier les forces et les faiblesses des schémas de métadonnées existants relativement aux questions de fiabilité, d’exactitude et d’authenticité des documents ; et ils ont à nouveau étudié le concept de « digne de confiance » et ses composants que sont la fiabilité, l’exactitude et l’authenticité, et ce qu’il recouvre, pas seulement dans les environnements juridiques et administratifs, mais aussi dans les secteurs artistiques et scientifiques et dans les sphères naissantes de l’administration électronique.
Les études de cas ont montré que la production de documents d’archives dans l’environnement numérique n’est quasiment jamais guidée par des considérations de conservation sur le long terme. Il s’ensuit que la fiabilité, l’exactitude et l’authenticité des documents d’archives numériques soit ne peuvent être établies, soit ne peuvent être démontrées sur les durées requises pour « l’activité495 » et le type de documents concernés. Ce qui, naturellement, n’est pas sans conséquences. Ces documents ne permettent pas au producteur de satisfaire à ses obligations légales. Le producteur ne peut s’y fier pour référence ou action ultérieure et ils ne constituent pas non plus des sources fiables pour les utilisateurs. Qui plus est, ils ne peuvent être compris dans un contexte historique, portant par là même atteinte au rôle traditionnel des institutions de conservation comme les services publics d’archives.
Les recherches conduites sur la législation des archives et le droit de l’information ont montré qu’à ce jour aucun gouvernement, aucune administration n’ont adopté de vision globale du cycle de vie des documents d’archives et que, dans certains cas, la législation a même créé des obstacles à la conservation des documents d’archives numériques sur le long terme, à commencer par la législation sur le droit d’auteur, la propriété intellectuelle et la protection des données à caractère personnel.
Il entrait dans les attributions de l’équipe de recherche transversale Stratégie et orientations d’InterPARES 2 de déterminer s’il était possible de définir un cadre de principes pour guider l’élaboration de politiques, de stratégies et de normes, et qui serait suffisamment flexible pour être utile dans différents contextes nationaux, et suffisamment robuste pour être adopté dans sa totalité comme base pour l’élaboration de ce type de documents. Un tel cadre se devait en particulier d’équilibrer différentes perspectives culturelles, sociales et juridiques sur les questions de l’accès à l’information, de la protection des données à caractère personnel et de la propriété intellectuelle.
Les travaux de l’équipe Stratégie et orientations d’InterPARES 2 ont confirmé les conclusions d’InterPARES 1, établissant qu’il était possible d’élaborer un cadre de principes pour accompagner la production, la maintenance et la conservation des documents d’archives, indépendamment des contextes juridiques. Le présent document, en combinaison avec les autres produits du projet, et en particulier le Modèle de chaîne archivistique (COP, Chain of Preservation)496, reprend cette conclusion, tout en insistant sur la nécessité d’expliciter la nature de la relation entre les producteurs de documents d’archives et les institutions en charge de leur conservation.
L’équipe Stratégie et orientations a élaboré deux ensembles complémentaires de principes, l’un à l’attention des producteurs de documents, l’autre à l’attention des services en charge de leur conservation. Ces principes ont vocation à contribuer à instaurer une relation entre producteurs et services d’archives en explicitant la nature de cette relation497. Les principes à l’usage des producteurs s’adressent aux personnes en charge de l’élaboration de politiques et de stratégies pour la production, la maintenance et l’utilisation de documents d’archives numériques au sein de tout type d’organisation, et aux organismes de normalisation nationaux et internationaux. Les principes à l’usage des services d’archives s’adressent aux personnes en charge de l’élaboration de politiques et de stratégies pour la conservation sur le long terme des documents d’archives numériques au sein de services administratifs ou d’institutions ayant pour mission principale la conservation d’ensembles de documents d’archives produits par des individus, des services administratifs ou des organisations, et retenus pour la conservation définitive en vertu de la législation en vigueur ou en raison de leur intérêt patrimonial. Ils s’adressent par conséquent aux services (par exemple, service d’archives d’une banque, d’une municipalité ou d’une université) et aux institutions (par exemple, archives municipales ou départementales) familiers des principes et méthodes de l’archivistique et de la conservation des documents d’archives.
Structure des principes
Chaque principe est présenté de manière identique : l’énoncé du principe est suivi d’un texte explicatif, et dans certains cas, d’exemples. Les principes sont le plus souvent formulés comme des recommandations, et non comme des obligations, parce que tous ne concernent pas nécessairement tous les producteurs et tous les services d’archives. L’énoncé de chaque principe est accompagné de l’indication du principe correspondant dans l’autre groupe (P pour producteurs et A pour services d’archives ; le chiffre correspond au numéro du principe dans le groupe P ou A). Il n’y a pas de correspondance directe entre les numéros des principes d’un groupe à l’autre (P1=A1) parce qu’ils sont énumérés dans chaque groupe par ordre d’importance relative.
Principes à l’usage des producteurs de documents d’archives
(P1) Les objets numériques doivent avoir un contenu stable et une forme fixe pour être considérés comme des documents d’archives et pouvoir être conservés dans le temps. (A5)
Le projet InterPARES a choisi de retenir la définition traditionnelle du document d’archives : « document produit ou reçu par toute personne physique ou morale et par tout service ou organisme public ou privé, dans l’exercice de leur activité et sélectionné en vue d’une action ultérieure ou à des fins de consultation498. » Selon cette définition, pour être considéré comme un document d’archives, un objet numérique produit par le producteur doit d’abord être un document ; c’est-à-dire, avoir un contenu stable et une forme documentaire fixe. Seuls les objets numériques possédant ces deux caractéristiques peuvent remplir la fonction mémorielle du document d’archives.
Le concept de contenu stable parle de lui-même. Il désigne simplement le fait que les données et les informations contenues dans le document (c’est-à-dire le message que le document est destiné à véhiculer) sont intactes et non modifiables. Cela implique que les données ou les informations ne peuvent être ni écrasées, ni modifiées, ni effacées ni augmentées. Ainsi, une organisation dont le système contiendrait des données ou des informations changeantes, qui évoluent constamment, n’a pas de documents d’archives dans ce système tant que quelqu’un ne décide pas d’en créer un et de le conserver avec son contenu immuable.
Le concept de forme fixe est plus complexe. Un objet numérique a une forme fixe lorsque son contenu binaire est stocké de telle façon que le message qu’il véhicule peut être restitué avec la même présentation documentaire que celle qu’il avait à l’écran la première fois où il a été enregistré. Parce qu’une même présentation documentaire peut être obtenue à partir de plusieurs présentations ou formats numériques499, la forme fixe n’implique pas que les trains de bits doivent demeurer inchangés dans le temps. Il est possible de modifier la manière dont un document est contenu dans un fichier informatique sans changer le document ; par exemple, si un document créé au format .doc est par la suite enregistré en .pdf, la manière dont il est restitué à l’écran – sa présentation documentaire, ou « forme » - n’a pas changé, de sorte que l’on peut dire que l’objet a une forme fixe.
Il arrive également que l’on produise de l’information numérique qui peut prendre plusieurs formes documentaires. Cela signifie que le même contenu peut être présenté à l’écran de différentes manières, ainsi des différents types de graphiques disponibles dans un tableur. Dans ce type de cas, chaque présentation d’un tel objet numérique parmi l’éventail limité des possibilités offertes par le système doit être considérée comme une vue différente du même document ayant un contenu stable et une forme fixe.
En outre, il convient de prendre en compte le concept de « variabilité limitée », qui désigne les modifications de la forme et/ou du contenu d’un document d’archives numérique qui sont limitées et contrôlées par des règles fixes, de sorte que la même interrogation, requête ou interaction produit toujours le même résultat500. Dans ce type de cas, les variations de la forme et du contenu du document sont causées soit par la technologie, par exemple différents systèmes d’exploitation ou applications utilisés pour accéder au document, soit par l’intention de l’auteur ou du rédacteur du document. Pour ce qui est du contenu, la même requête retournera toujours le même sous-ensemble alors que, comme cela a été dit, sa présentation pourra varier dans des limites autorisées, ainsi de la modification de la taille de l’image. Dans la mesure où ce qui provoque ces variations les limite aussi, elles ne sont pas considérées comme contrevenant à la condition requise de contenu stable et de forme fixe.
Il est recommandé aux organisations de définir des critères pour déterminer quels objets numériques doivent être maintenus comme documents d’archives et quelles méthodes seront utilisées pour stabiliser leur forme et leur contenu s’ils sont changeants lors de leur production. Les critères doivent être fondés sur les besoins de l’organisation concernée, mais devront également respecter les obligations légales, administratives ou patrimoniales qui s’appliquent.
(P2) Les procédures de production des documents d’archives doivent garantir que les composants numériques des documents pourront être maintenus séparément et réassemblés dans le temps. (A4)
Tout document d’archives numérique est constitué d’un ou plusieurs composants numériques. Un composant numérique est un objet numérique qui fait partie d’un ou plusieurs documents numériques, y compris les métadonnées requises pour classer, structurer ou représenter le contenu, et qui requiert une action de conservation donnée. Par exemple, un courriel contenant une image et une signature numérique aura au moins quatre composants numériques (l’en-tête, le texte, l’image et la signature numérique). Un rapport accompagné de pièces annexes dans différents formats sera constitué de plusieurs composants numériques, alors qu’un rapport enregistré avec ses pièces annexes dans un fichier PDF sera constitué d’un seul composant numérique. Bien que les composants numériques soient stockés séparément, chaque composant numérique existe dans une relation particulière aux autres composants numériques qui constituent le document.
La conservation des documents numériques requiert que tous les composants numériques d’un document soient systématiquement identifiés, liés et stockés de telle sorte qu’ils puissent être récupérés et reconstitués en un document ayant la même présentation que celle qu’il avait lors de sa dernière fermeture. Chaque composant numérique requiert une ou plusieurs méthodes spécifiques pour décoder le train de bits et le présenter en vue de son utilisation dans le temps. Le train de bits peut être modifié, à la suite d’une conversion par exemple, sous réserve qu’il puisse toujours remplir son rôle initial dans la reproduction du document. Tous les composants numériques doivent pouvoir fonctionner ensemble après avoir été modifiés ; par conséquent, toutes les modifications doivent être évaluées par le producteur afin de déterminer les incidences qu’elles pourraient avoir sur le document.
Il est recommandé aux organisations de mettre en place des politiques et des procédures qui stipulent d’identifier les composants numériques au stade de la production du document et qui garantissent qu’ils pourront être maintenus, transmis, reproduits, mis à niveau et réassemblés dans le temps.
(P3) Les conditions requises pour la production et la maintenance des documents d’archives doivent être formulées en fonction des finalités assignées aux documents, et non des technologies disponibles ou choisies pour leur production ou leur archivage. (A6)
Par nature, les documents d’archives numériques sont tributaires de l’informatique et toute représentation d’un document d’archives existe dans un certain environnement technologique. Dès lors, on pourrait être tenté de définir les conditions requises de production et de maintenance des documents en fonction de leurs caractéristiques technologiques ou des systèmes informatiques dans lesquels ils sont exploités. Mais les technologies évoluent, parfois très rapidement, et elles sont en outre gouvernées par des considérations fixées et modifiées à leur guise par leurs développeurs. Ces deux facteurs peuvent avoir de lourdes conséquences sur l’accessibilité des documents dans le temps. C’est pourquoi il est fortement déconseillé de faire figurer des références à des technologies données dans les politiques, les stratégies et les normes gouvernant la production et la maintenance des documents d’archives d’une organisation. Seules les exigences liées aux activités de l’organisation et les obligations que les documents sont destinés à étayer doivent être explicitement prises en considération à ce niveau réglementaire. Au niveau de la mise en œuvre, en revanche, les caractéristiques de technologies spécifiques devront être prises en compte pour satisfaire et permettre les obligations métier.
Les solutions technologiques de production et de maintenance des documents d’archives sont dynamiques, ce qui signifie qu’elles évolueront au rythme des technologies. De nouvelles technologies rendront possibles de nouvelles manières de produire des documents répondant aux besoins de l’organisation. L’adoption rapide des technologies web pour la communication et les transactions des entreprises est une illustration de ce phénomène. Les activités nécessaires pour assurer la maintenance des documents devront par conséquent être adaptées en permanence à de nouvelles situations en capitalisant sur les connaissances et le savoir-faire acquis dans diverses disciplines. Pour reprendre l’exemple de l’utilisation des technologies web, les organisations qui produisent et maintiennent des documents transactionnels dans un environnement informatique adossé à un ordinateur central doivent s’appuyer sur la connaissance des nouvelles technologies web tant du point de vue de la connectivité (comment connecter l’ordinateur central à Internet) que de celui de la sécurité (comment protéger les documents des attaques informatiques). À mesure que de nouvelles technologies seront utilisées pour produire des documents, de nouvelles connaissances archivistiques seront requises.
Pour être efficaces, les solutions technologiques doivent être spécifiques. Bien que la théorie et la méthodologie générales de la préservation numérique s’appliquent à tous les documents d’archives numériques, les solutions de maintenance pour les différents types de documents requièrent différentes méthodes. Elles doivent donc être fondées sur le contexte juridico-administratif dans lequel les documents sont produits et maintenus, le mandat, la mission ou les objectifs de leur producteur, les fonctions et les activités auxquelles participent les documents et les technologies employées pour leur production, afin de garantir que les meilleures solutions soient adoptées pour leur maintenance.
Les politiques de gestion des documents d’archives formulées en termes de besoins de l’organisation devront être périodiquement mises à jour avec l’évolution des besoins de l’organisation, et non au rythme des évolutions technologiques. C’est le rôle d’un plan d’action spécifique d’identifier les solutions technologiques pertinentes pour la maintenance d’ensembles spécifiques de documents. Les solutions retenues devront être surveillées et régulièrement réévaluées afin de détecter quand elles doivent être modifiées et mises à niveau. Il convient que l’organisme producteur des documents se tienne informé des évolutions dans le domaine de l’archivistique et du records management et qu’il collabore à des initiatives interdisciplinaires pour développer des méthodes adéquates de gestion des documents d’archives numériques.
(P4) Les politiques, stratégies et normes pour la production et la maintenance de documents d’archives doivent apporter des réponses explicites et individualisées aux problèmes de fiabilité, d’exactitude et d’authenticité des documents. (A2)
Dans la gestion des documents d’archives numériques, la fiabilité, l’exactitude et l’authenticité sont trois éléments essentiels à prendre en compte par toute organisation souhaitant garantir la compétitivité de ses activités et satisfaire à ses obligations légales et réglementaires. Ces trois questions doivent être abordées directement et séparément dans les politiques de gestion des documents d’archives de l’organisation et largement diffusées. Le concept de fiabilité (authenticité diplomatique) renvoie à l’autorité et la qualité du document d’archives d’être digne de confiance en tant que représentation des faits auxquels il se rapporte ; c’est-à-dire qu’on peut lui accorder foi en tant qu’énoncé des faits. La fiabilité désigne le fait que le contenu d’un document est digne de confiance. Elle peut être déduite de deux choses : le degré de complétude de la forme du document et le degré de contrôle sur la procédure (ou le workflow) au cours de laquelle il est créé. Dès lors, la fiabilité est exclusivement liée à la paternité du document et elle est de la seule responsabilité de la personne ou de l’organisation qui crée le document. Parce que, par définition, le contenu d’un document fiable est digne de foi, et qu’un contenu digne de foi est fondé sur des données exactes, il s’ensuit qu’un document d’archives fiable est aussi un document d’archives exact.
Un document d’archives exact est un document d’archives qui contient des données correctes, précises et justes. L’exactitude (authenticité historique) d’un document peut également indiquer le caractère absolu des données qu’il rapporte ou sa pertinence parfaite ou exclusive pour l’affaire en question. L’exactitude d’un document est présumée lorsque le document est produit et utilisé au cours des processus métier pour accomplir des fonctions métier, selon l’hypothèse que des documents inexacts nuisent aux intérêts de l’organisation. Toutefois, lorsque les documents sont transmis d’un système à un autre, rafraîchis, convertis ou migrés pour continuer à être utilisés, ou lorsque la technologie dont procède le document est mise à niveau, les données contenues dans le document doivent être vérifiées pour garantir que leur exactitude n’a pas été endommagée par des erreurs techniques ou humaines survenues au cours des processus de transmission ou de transformation. L’exactitude des données doit également être vérifiée lorsque les documents sont produits en important des données d’autres systèmes de documents. Cette vérification relève de la responsabilité de la personne physique ou morale qui reçoit les données ; toutefois, celle-ci n’est pas responsable de la justesse des données, qui est de la responsabilité de la personne émettrice. La personne recevant les données devra donc veiller à indiquer qu’elle ne saurait être tenue pour responsable de l’exactitude des documents d’archives utilisant les données de tiers.
Le concept d’authenticité (authenticité juridique) désigne le fait qu’un document est bien ce qu’il prétend être et qu’il n’a été ni corrompu ni altéré. En d’autres termes, l’authenticité désigne le fait qu’un document d’archives est digne de confiance en tant que document d’archives. Un document d’archives authentique est aussi fiable et exact qu’il l’était lorsqu’il a été produit. On peut maintenir et vérifier l’authenticité d’un document en maintenant son identité et son intégrité. L’identité d’un document est établie et maintenue en indiquant au minimum : le nom des personnes ayant participé à la production du document (par exemple, auteur, destinataire) ; l’action ou l’affaire à laquelle participe le document ; les dates d’élaboration, classement ou transmission ; la forme du document ; la présentation numérique (ou format) du document ; la relation du document avec les autres documents au moyen d’une cote ou d’une convention de nommage ; et l’existence de pièces jointes. L’intégrité d’un document est établie et maintenue par l’identification des responsables du document dans le temps en donnant le nom du service métier501 et du responsable des archives502 ou du service de records management503, par la définition des droits d’accès étendus504 et des droits d’accès restreints505 et par l’indication de toute mention ou toute modification (technique ou autre) portée au document par les personnes y ayant accès.
La fiabilité du document d’archives est donc une qualité qui est établie lorsqu’un document est créé et qui implique la qualité des données qu’il contient, alors que l’exactitude et l’authenticité d’un document sont des concepts qui sont liés à la transmission et à la maintenance du document. L’exactitude et l’authenticité relèvent donc de la responsabilité du producteur du document et de son successeur légitime. L’authenticité est protégée et garantie par l’adoption de méthodes qui assurent que le document n’est pas modifié, altéré ou falsifié de toute autre manière après sa production, au cours de sa transmission ou pendant sa prise en charge et sa conservation dans le système d’archivage506.
(P5) Un système digne de confiance doit être utilisé pour produire des documents d’archives qui puissent être présumés fiables507.
Un système de gestion des documents digne de confiance consiste en un ensemble de règles gouvernant la production des documents d’archives et un ensemble d’outils et de mécanismes utilisés pour appliquer ces règles. Pour générer des documents fiables, tout système produisant des documents doit comporter des procédures métier et des procédures documentaires intégrées, des schémas des métadonnées utilisées, des formes documentaires, une gestion des droits d’accès (droits d'accès étendus) et des conditions technologiques requises pour la production des documents.
Par intégration des procédures métier et des procédures documentaires, on entend des procédures métier liées à des procédures documentaires et au système de classement (plan de classement, taxinomie) en vigueur dans l’organisation. Cette intégration renforce le contrôle sur les procédures de production des documents : elle étaye la fiabilité des documents en les reliant explicitement aux activités auxquelles ils participent et au système d’organisation des documents, normalisant ainsi les procédures de production et de gestion de ces documents. L’intégration des procédures métier et des procédures documentaires est également ce qui fonde et permet de démontrer la propriété et la responsabilité sur les documents. Un schéma de métadonnées pour la production de documents est la liste de tous les éléments de métadonnées qui doivent être renseignés au cours des processus de production des documents en vue d’identifier chaque document de manière unique et de pouvoir maintenir son intégrité et la présomption de son authenticité. Ce type de schéma pourra également être utilisé par la suite pour vérifier l’authenticité des documents si celle-ci venait à être remise en question. Par forme documentaire, on entend les spécifications de forme des divers types de documents produits dans le système. Les droits d’accès étendus désignent le droit de composer, éditer, annoter, lire, récupérer, transférer et/ou détruire des documents dans le système, accordé par le producteur à des responsables et des employés sur la base des définitions de poste et des besoins de l’organisation. Les droits d’accès contrôlent l’accès au système et sont définis au cours de l’intégration des procédures métier et de procédures documentaires en reliant des catégories spécifiques de documents au service responsable d’une fonction ou d’une activité métier. La définition et la mise en place des droits d’accès étendus est la mesure la plus importante pour garantir que la fiabilité des documents pourra être présumée. Les conditions technologiques requises comprennent les spécifications du matériel et des logiciels du système ayant un impact direct sur la forme des documents.
(P6) Un système de records management de confiance doit être utilisé pour maintenir des documents d’archives qui puissent être présumés exacts et authentiques. (A11, A12)
Un système de records management de confiance consiste en un ensemble de règles gouvernant l’archivage des documents et un ensemble d’outils et de mécanismes utilisés pour appliquer ces règles. Tout système d’archivage doit comporter un schéma de métadonnées d’archivage, un plan de classement, un tableau de gestion, un système d’enregistrement, un outil de recherche, des conditions technologiques requises, une gestion des droits d’accès et des procédures pour maintenir les documents exacts et authentiques.
Le schéma des métadonnées d’archivage est la liste de toutes les métadonnées devant être associées à un document afin de garantir la continuité de son identité et de son intégrité dans le système de records management. Un plan de classement est un système d’identification et d’organisation des activités métier et des documents d’archives par catégorie, selon des conventions, méthodes et règles procédurales structurées. Un tableau de gestion est un document qui décrit des ensembles de documents d’archives et fixe les modalités de leur sort final. Un système d’enregistrement est une méthode pour attribuer un identifiant unique à chaque document d’archives produit, lié à ses métadonnées d’identification et d’intégrité. Les droits d’accès étendus sont le droit de classer, annoter, lire, extraire, transférer et/ou détruire des documents dans le système d’archivage, accordé par le producteur des documents à des responsables et des employés sur la base des définitions de postes et des besoins de l’organisation. En règle générale, l’accès aux documents pour classification, transfert et destruction n’est accordé qu’au responsable archives de l’organisation. Un outil de recherche est un ensemble de règles gouvernant la recherche et la récupération de documents d’archives et/ou d’informations sur les documents dans un système d’archivage, et les outils et mécanismes utilisés pour appliquer ces règles. Les conditions technologiques requises désignent les spécifications du matériel et des logiciels du système de records management. Les procédures pour maintenir des documents d’archives exacts et authentiques sont des procédures visant à garantir que les données des documents et l’identité et l’intégrité de ces derniers dans le système d’archivage sont protégées de toute corruption ou perte accidentelles ou intentionnelles.
Afin d’améliorer leurs performances et de limiter les possibilités d’erreurs humaines, les systèmes de gestion et d’archivage des documents doivent automatiser, autant que faire se peut, la création des métadonnées d’identification et d’intégrité aux points de production ou de modification des documents (par exemple, lorsqu’ils sont migrés dans un nouveau système ou un nouveau format de fichier), et chaque fois que les ensembles auxquels ils appartiennent sont créés ou modifiés – toute unité de documents doit hériter automatiquement des métadonnées du niveau supérieur de classement et chaque fois que les métadonnées de niveau supérieur sont mises à jour.
Le producteur des documents doit indiquer dans sa politique de gestion des documents d’archives qu’il est de la responsabilité du records manager de gérer le système de records management. Le rôle du records manager est identique à celui de l’archiviste tiers de confiance, et il doit donc posséder des qualifications identiques à celui-ci, telles que répertoriées dans le Principe P8.
Un système de records management dont la conception et la gestion satisfont aux conditions requises et procédures indiquées ci-dessus est capable de garantir l’exactitude et l’authenticité des documents d’archives après leur production, ces conditions requises et procédures assurant un contrôle maximal de la maintenance et de l’utilisation des documents.
(P7) Les considérations sur la conservation doivent être intégrées à toutes les activités impliquées dans la production et la maintenance des documents d’archives si un producteur souhaite maintenir et conserver des documents exacts et authentiques par-delà ses besoins opérationnels. (A7)
En archivistique, le concept de cycle de vie du document d’archives renvoie à la théorie selon laquelle les documents d’archives passent par différents stades, à savoir : production, utilisation et maintenance, et sort final (c’est-à-dire, leur destruction ou leur conservation définitive).
Il est essentiel que les producteurs de documents d’archives ayant à traiter des documents sous forme numérique comprennent que, à la différence de ce qui prévaut avec les documents papier, la conservation est un processus ininterrompu qui débute dès la production des documents. Traditionnellement, les décisions sur le sort final sont prises au stade du sort final des documents, lorsqu’ils ne sont plus requis par l’organisation pour la conduite de ses activités ou pour des raisons juridiques ou administratives. Avec les documents d’archives numériques, les décisions relatives au sort final doivent être prises le plus près possible du stade de production du fait de la facilité avec laquelle ils peuvent être manipulés et effacés, ou perdus à cause de l’obsolescence technologique.
Dès lors que l’on considère que la conservation des documents commence avec leur production, il convient que les considérations sur la conservation soient prises en compte et intégrées dans la conception des systèmes de gestion et d’archivage des documents. Chaque ensemble de documents faisant l’objet d’une évaluation doit être identifié conformément au plan de classement et au tableau de gestion définis par le producteur, et cette identification doit apparaître dans les métadonnées des documents. Les ensembles de documents ainsi identifiés doivent être surveillés tout au long de leur cycle de vie de façon à ce que les résultats de l’évaluation puissent être actualisés et/ou modifiés afin de tenir compte de tout changement qui interviendrait après leur production. Pour ce faire, le service d’archives en charge de la conservation définitive doit pouvoir accéder au système d’archivage électronique de l’organisation. Des politiques et procédures doivent être définies afin de faciliter les interactions et la collaboration entre le producteur et le service d’archives qui prendra en charge ces documents.
(P8) Un service d’archives tiers de confiance doit être désigné pour prendre en charge les documents d’archives du producteur. (A1)
Le service d’archives désigné est l’entité responsable juridiquement de la prise en charge et de la conservation508 (c’est-à-dire, protéger et assurer un accès ininterrompu à) des copies authentiques des archives définitives509 d’un producteur. Qu’il s’agisse d’une organisation extérieure ou d’un service interne, le rôle du service d’archives désigné doit être celui d’un archiviste tiers de confiance à l’égard des documents du producteur. Pour être considéré comme un archiviste tiers de confiance, le service d’archives doit :
- agir en tiers neutre ; c’est-à-dire, démontrer qu’il n’est pas concerné par le contenu des documents, qu’il n’a pas de raison de modifier les documents placés sous sa responsabilité et qu’il ne permettra à personne de modifier les documents accidentellement ou délibérément ;
- disposer des connaissances et des compétences nécessaires pour remplir ses obligations, sanctionnées par une formation reconnue en archivistique et ingénierie documentaire ; et
- mettre en place un système de conservation de confiance capable de garantir que des copies fiables et authentiques des documents du producteur sont prises en charge et conservées.
Tant que les documents d’archives sont maintenus par le producteur dans son système d’archivage, ce sont des archives courantes ou intermédiaires510, bien qu’elles soient sous la responsabilité d’un responsable des archives. Un archiviste tiers de confiance reconnu par le producteur comme son service d’archives désigné doit maintenir les documents qui ont été retirés du système de records management en vue de leur conservation sur le long terme ou de leur conservation définitive. Cet archiviste établira et maintiendra un système de conservation pour accueillir et conserver les documents d’archives numériques du producteur. Il devra veiller à ce que l’exactitude et l’authenticité des documents reçus du producteur soient évaluées et maintenues. Dans ce cadre, l'archiviste désigné identifie les politiques et procédures de conservation appropriées, s’appuyant sur les connaissances et le savoir-faire de diverses disciplines, et en particulier de l’archivistique, de l’informatique et du droit. Les procédures de conservation sont mises en œuvre dans le cadre du système de conservation.
Seuls les services d’archives qui satisfont aux conditions requises de l’archiviste tiers de confiance sont capables de remplir leurs obligations de conservation dans le temps de documents d’archives authentiques et de conférer une présomption d’authenticité aux copies authentiques qu’ils produisent à des fins de conservation.
(P9) Tous les processus métier qui contribuent à la production et/ou à l’utilisation des mêmes documents d’archives doivent être explicitement documentés. (A10)
Les documents produits au cours de l’exécution d’une fonction ou d’un processus métier sont souvent utilisés par d’autres fonctions ou processus métier. Il peut alors advenir que les documents produits par différentes activités ne soient associés qu’à une seule activité dans le système de gestion ou d’archivage des documents du producteur, ou ne soient associés à aucune activité dans une application ou un système « d’information » central. Il est alors plus difficile pour le producteur d’identifier les ensembles de documents relevant d’une obligation donnée et pour le service d’archives désigné, de conduire les activités d’évaluation et de conservation.
Il est recommandé de mettre en place des politiques et des procédures stipulant que soit rédigée une description détaillée de tous les processus et fonctions métier qui contribuent à la production et à l’utilisation des mêmes documents dans toute application ou tout système du producteur, ainsi qu’un lien explicite entre chaque document et le workflow correspondant. L’élaboration de manuels de procédures décrivant ces éléments est un bon moyen de sensibiliser à l’impact de la production et de l’archivage de documents sur la gestion d’une organisation. L’utilisation ultérieure différente des documents, après leur production, pourra être indiquée dans des métadonnées, qui peuvent également indiquer les contextes dans lesquels les documents ont été produits.
(P10) Les droits de propriété intellectuelle tiers attachés aux documents d’archives du producteur doivent être explicitement identifiés et gérés dans les systèmes de gestion et d’archivage des documents. (A8)
Tout producteur de documents d’archives sait généralement que les documents qu’il produit, ou qui sont placés sous son contrôle ou sa responsabilité, contiennent des informations tombant sous le coup du droit de la propriété intellectuelle. Les producteurs doivent également avoir présent à l’esprit que, dans certains cas, les droits de propriété intellectuelle associés à un document peuvent appartenir à un tiers autre que l’auteur ou le destinataire des documents.
Tous les droits de propriété intellectuelle attachés à un document d’archives doivent être documentés dans les métadonnées associées au document lorsqu’il est créé ou reçu et pris en charge. Les droits de propriété intellectuelle peuvent avoir des conséquences importantes pour la reproduction des documents, dont le rôle est central dans tous les processus de rafraîchissement, de conversion et de migration. Soumise à des contraintes différentes selon les environnements juridiques, la reproduction de documents grevés de droits de propriété intellectuelle détenus par des tiers peut contrevenir à la législation qui protège ces droits. Il convient donc de prendre en compte ces contraintes juridiques dès la conception des systèmes de gestion et d’archivage des documents. En ce qui concerne les documents sélectionnés pour être conservés sur le long terme, la politique de gestion des documents du producteur devra indiquer de manière explicite ce qu’il en est de ces droits sur le long terme et que, le cas échéant, les autorisations nécessaires ont été obtenues.
(P11) Les droits et obligations relatifs aux données à caractère personnel attachés aux documents d’archives du producteur doivent être explicitement identifiés et protégés dans les systèmes de gestion et d’archivage des documents. (A9)
La législation sur les données à caractère personnel protège les droits des individus relativement à toute donnée à caractère personnel pouvant être contenue dans tout document utilisé et maintenu par un producteur avec qui ils ont des interactions. Les limites de cette protection dépendent du cadre juridique dans lequel opère le producteur. Ce cadre juridique peut entrer en conflit avec la politique d’accès aux documents prévue par la mission du producteur et même avec la législation sur l’accès à l’information au sein du même système juridique.
La présence d’informations à caractère personnel dans les documents d’archives doit être constatée et documentée dans les schémas de métadonnées associés aux documents dans les systèmes de gestion et d’archivage du producteur. Les schémas de métadonnées qui constatent et administrent l’utilisation des données à caractère personnel doivent être intégrés aux systèmes de gestion et d’archivage des documents. Les informations personnelles pourront ainsi être protégées par la mise en place de droits d’accès au niveau du système dans son ensemble. Dans le cas de documents devant être conservés définitivement, les problèmes de protection des données à caractère personnel liés à l’accès aux documents doivent être expressément résolus (c’est-à-dire que des autorisations explicites doivent être obtenues auprès des personnes concernées), dans l’idéal avant la production des documents. C’est le meilleur moyen de garantir que les documents seront gérés dans le respect de la législation sur la protection des données à caractère personnel et que le service d’archives désigné pourra inclure ces questions dans l’étude de faisabilité menée dans le cadre de l’évaluation archivistique. En tant qu’archiviste tiers de confiance, le service d’archives désigné devrait être autorisé à accéder aux documents contenant des données à caractère personnel afin d’accomplir les activités de conservation. Le traitement de données à caractère personnel à des fins de maintenance ou de conservation des documents est à distinguer de leur utilisation à des fins de recherche ou à des fins commerciales. Quel que soit le contexte juridique, le producteur doit être en mesure de démontrer que le traitement des documents contenant des données à caractère personnel n’expose pas ces données à des accès non autorisés.
C’est le producteur et ses successeurs légitimes qui doivent être investis de la responsabilité du traitement de documents contenant des données à caractère personnel à des fins de maintenance et de conservation. Bien que dans la plupart des pays, la législation sur la protection des données à caractère personnel autorise et encadre la sous-traitance de ces activités à des sociétés spécialisées, il est recommandé d’éviter dans la mesure du possible de recourir à cette pratique afin de limiter le nombre d’individus autorisés à accéder à et/ou traiter les documents, réduisant par là même le risque de divulguer des informations personnelles contenues dans les documents et de compromettre la capacité d’obtenir l’autorisation de traiter des données à caractère personnel à des fins de maintenance ou de conservation.
Dans le cas de documents d’archives n’ayant pas encore été désignés pour la conservation définitive, les décisions sur leur sort final devraient être prises avant l’expiration du mandat initial autorisant le traitement de données à caractère personnel, ceci afin de garantir que les conditions juridiques pour conserver ces documents soient toujours réunies.
(P12) Les procédures de partage des documents entre différents systèmes juridiques doivent être définies sur la base des obligations légales sous lesquelles les documents sont produits. (A13)
Les producteurs de documents ayant des filiales dans des zones géographiques relevant de différents systèmes juridiques doivent être conscients que des régimes différents de communicabilité et de protection des données à caractère personnel et de propriété intellectuelle peuvent avoir une influence sur le partage de leurs documents, c’est-à-dire sur les échanges de documents au sein de l’organisation elle-même et avec des organisations extérieures telles que l’administration ou ses partenaires. Entre notamment dans ce champ la transmission de documents à un service d’archives désigné lorsque celui-ci opère dans un environnement juridique différent de celui du producteur des documents.
Le fait que des documents soient librement accessibles dans un environnement juridique donné n’implique pas qu’ils soient accessibles dans les mêmes conditions dans d’autres systèmes juridiques. Les producteurs doivent se renseigner sur ces aspects et y apporter des réponses dans leurs politiques.
(P13) Les reproductions d’un document faites par le producteur dans le cours habituel de son activité et aux fins de celle-ci, au titre de ses activités d’archivage, ont les mêmes effets que la première représentation du document et toutes doivent être considérées à tout moment comme documents d’archives du producteur. (A3)
Dans l’environnement numérique, la première représentation d’un document, qu’il s’agisse d’un état préparatoire, d’un original ou d’une copie, n’existe que lorsqu’elle est affichée pour la première fois dans le système de gestion documentaire du producteur s’il s’agit d’un document interne, ou reçue pour la première fois dans le système d’archivage du producteur, s’il s’agit d’un document reçu de l’extérieur. Lorsque le document est fermé et enregistré dans le système de gestion ou d’archivage du producteur, techniquement sa première représentation disparaît, l’enregistrement le décomposant en ses composants numériques. Toute représentation ultérieure du document numérique est une reproduction résultant de l’assemblage de ses composants numériques. Conceptuellement, toutefois, les producteurs peuvent utiliser toute reproduction de la première manifestation de celui-ci comme s’il s’agissait de la première représentation du document, sous réserve que la reproduction soit produite dans le cours habituel et ordinaire des activités du producteur et utilisée pour ces activités. Cela signifie que chaque reproduction successive devrait avoir la même admissibilité devant un tribunal que la première représentation du document et que le même poids devrait lui être accordé.
Pour établir qu’un document est reproduit dans le cours ordinaire et habituel des affaires, il est nécessaire de fixer par écrit des procédures. De fait, si des documents fiables ont été produits dans un système digne de confiance et que leur authenticité et leur intégrité ont été maintenues avec celles des documents reçus dans le système d’archivage du producteur, alors, tous les documents auront la même autorité et les mêmes effets que leur première représentation.
Selon la diplomatique, dans un système numérique, un document « original » est la première représentation d’un document reçu, et après la fermeture de celle-ci, l’original n’existe plus. Ceci étant posé, il est intéressant d’examiner trois exemples de lois concernant la signification du mot « original ». Elles ont en commun le principe selon lequel c’est la relation d’un document avec les activités du producteur qui détermine si le document en question est revêtu de l’autorité et des effets d’un original.
Exemple 1 : Aux États-Unis, les Federal Rules of Evidence établissent une distinction entre les originaux et les copies, les originaux étant investis d’une plus grande valeur de preuve. Pour les documents d’archives numériques, il est à noter que si « les données sont stockées dans un ordinateur ou un appareil de même type, toute sortie papier ou toute autre sortie déchiffrable par l’œil, dont on aura établi qu’elle reflète fidèlement les données, est un « original »511. »
Exemple 2 : Dans la législation italienne, la qualité d’original confère davantage de poids ou de crédibilité aux documents d’archives. La législation italienne met l’accent sur la différence entre les données numériques (l’original) et tout type de « sortie » de ces données (la copie), en établissant que « toute donnée ou tout document créés sous forme numérique par toute administration publique représente une source primaire et originale d’information qui peut être utilisée pour faire des copies sur tout type de support à toute fin juridique512. »
Exemple 3 : La Loi de la République Populaire de Chine sur la signature électronique considère un document d’archives numérique comme un original s’il satisfait aux deux qualités suivantes : il doit pouvoir 1) présenter effectivement le contenu et être consulté à tout moment, et 2) démontrer à tout moment le maintien de l’intégrité de son contenu depuis sa première représentation. Toutefois, les ajouts faits à un document de données numériques et les modifications de présentation survenant au cours de l’échange, du stockage et de l’affichage des données ne sont pas considérés comme affectant son intégrité513.
Principes à l’usage des services d’archives en charge de la conservation définitive
(A1) Le service d’archives désigné a le rôle d’un archiviste tiers de confiance. (P8)
Le service d’archives désigné est l’entité responsable juridiquement de la prise en charge et de la conservation (c’est-à-dire, protéger et assurer un accès ininterrompu à) des copies authentiques des archives définitives d’un producteur. Qu’il s’agisse d’une organisation extérieure ou d’un service interne, le rôle du service d’archives désigné doit être celui d’un archiviste tiers de confiance à l’égard des documents du producteur. Pour être considéré comme un archiviste tiers de confiance, le service d’archives doit :
- agir en tiers neutre ; c’est-à-dire, démontrer qu’il n’est pas concerné par le contenu des documents, qu’il n’a pas de raison de modifier les documents placés sous sa responsabilité et qu’il ne permettra à personne de modifier les documents accidentellement ou délibérément ;
- disposer des connaissances et des compétences nécessaires pour accomplir ses obligations, sanctionnées par une formation reconnue en archivistique et ingénierie documentaire ; et
- mettre en place un système de conservation de confiance capable de garantir que des copies fiables et authentiques des documents du producteur sont prises en charge et conservées.
La prise en charge des documents du producteur est engagée par le service d’archives qui, après en avoir évalué l’exactitude et l’authenticité, en produit une copie authentique à partir du système de records management du producteur. Les documents pris en charge de cette manière sont des copies authentiques des documents du producteur retenus pour être conservés sur le long terme, parce qu’ils sont réalisés par le service d’archives dans son rôle d’archiviste tiers de confiance.
Les copies authentiques des documents du producteur sont alors conservées par le service d’archives désigné dans un système d’archivage pérenne, devant comporter un système de description et un système de recherche et de consultation des documents. Ce système d’archivage pérenne doit également mettre en œuvre des règles et des procédures pour continuer à produire des copies authentiques lorsque le système existant deviendra obsolète et que la technologie sera mise à niveau. Cette condition requise est conforme aux recommandations finales d’InterPARES 1 qui a élaboré les Conditions de base requises pour la production de copies authentiques de documents d’archives numériques514, ensemble de conditions requises devant être mises en place par le service d’archives. Il convient de souligner que le seul fait de reproduire les documents dans le système d’archivage ne suffit pas à faire de ces copies des copies authentiques ; le service d’archives doit les désigner comme telles.
Une politique de conservation pérenne exige une collaboration étroite entre le producteur des documents et le service d’archives désigné. Il est de la responsabilité du service d’archives de prendre l’initiative de cette collaboration avec le producteur en vue de définir des procédures de prise en charge et de conservation, et d’accompagner le producteur dans toute activité de gestion des documents essentielle pour les activités de prise en charge et de conservation du service d’archives.
(A2) Les politiques, stratégies et normes pour la conservation des documents d’archives doivent apporter des réponses explicites et individualisées aux problèmes d’exactitude et d’authenticité des documents. (P4)
Un document d’archives exact est un document d’archives qui contient des données correctes, précises et justes. L’exactitude (authenticité historique) d’un document est présumée lorsque le document est produit et utilisé dans le cours des processus métier pour accomplir des fonctions métier, selon l’hypothèse que des documents inexacts nuisent aux intérêts de l’organisation. Toutefois, lorsque les documents sont transmis d’un système à un autre, rafraîchis, convertis ou migrés en vue de leur conservation, ou lorsque la technologie où réside le document est mise à niveau, les données contenues dans le document doivent être vérifiées pour garantir que leur exactitude n’a pas été endommagée par des erreurs techniques ou humaines survenues au cours des processus de transmission ou de transformation. Cette vérification relève de la responsabilité du service d’archives qui conduit le processus de transmission ou de transformation ; toutefois, celui-ci n’est pas responsable de la justesse des données, qui reste de la responsabilité du producteur, tout comme la fiabilité des documents contenant les données.
Le concept d’authenticité (authenticité juridique) désigne le fait que le document d’archives est bien ce qu’il prétend être et qu’il n’a été ni corrompu ni altéré. En d’autres termes, l’authenticité désigne le fait qu’un document d’archives est digne de confiance en tant que document d’archives. Un document est authentique si on peut démontrer qu’il est tel qu’il était lorsqu’il a été produit. L’authenticité dépend de la transmission du document et de la façon dont il est pris en charge et conservé. Elle est donc de la responsabilité tant du producteur que de son successeur légitime (c’est-à-dire la personne ou l’organisation qui assure les missions en vertu desquelles les documents existent et qui conserve les documents eux-mêmes, ou les confie à un service d’archives désigné).
L’authenticité d’un document peut être protégée et vérifiée en garantissant que son identité et son intégrité soient maintenues. L’identité d’un document est ce qui le distingue de tous les autres documents. Elle est déclarée au moment de la production en indiquant au minimum les attributs suivants : noms des personnes participant à la production du document (par exemple, auteur, destinataire) ; l’action ou l’affaire à laquelle participe le document ; la ou les date(s) d’élaboration, classement ou transmission ; la forme du document ; la présentation numérique (ou format) du document ; la relation du document avec les autres documents au moyen d’une cote ou d’une convention de nommage ; et l’existence de pièces jointes. L’identité du document ainsi déclarée doit être maintenue intacte dans le temps d’abord par le producteur et son responsable des archives lorsque le document est toujours utilisé par le producteur, puis par le service d’archives désigné lorsque le document rejoint les archives définitives. L’intégrité d’un document désigne sa complétude et le fait qu’il reste inchangé dans ses aspects essentiels et elle ne peut être inférée qu’à partir de preuves indirectes concernant la personne qui avait la responsabilité du document dans le temps, à partir des droits et restrictions d’accès, et à partir de l’indication de tout ajout ou modification (technique ou autre) que des personnes ayant accès au document auraient pu y apporter. Dès lors, l’établissement et la maintenance de l’intégrité d’un document sont étayés en indiquant les attributs suivants : nom du ou des services métier, du service responsable515 et/ou du service d’archivage et du service d’archives désigné ; le code de droits d’accès étendus516 et le code de droits d’accès restreints517 ; et la liste des additions et mentions518, ainsi que des changements de format519.
L’authenticité n’est pas une qualité qui peut être conférée aux documents après leur production et leur maintenance, par un processus de conservation. Le service d’archives peut seulement protéger et maintenir ce qui a été transféré sous sa responsabilité. L’authenticité est protégée et maintenue par l’adoption de méthodes qui garantissent que le document n’est pas manipulé, modifié ou altéré de toute autre manière après son versement. Il est de la responsabilité du service d’archives désigné d’évaluer l’authenticité des documents dont on envisage la prise en charge dans un système de conservation et de garantir qu’elle demeure intacte après le transfert dans ce système en respectant au sein de ce service les mêmes Conditions de référence requises que celles qui s’imposent au producteur (par exemple, droits d’accès étendus, mesures contre la perte ou la corruption des documents, etc.) et les Conditions de base requises pour les services d’archives.
(A3) Les reproductions des documents d’archives d’un producteur réalisées à des fins de conservation par l’archiviste tiers de confiance doivent être considérées comme des copies authentiques des documents du producteur. (P13)
Les reproductions des documents d’archives originaux dans les systèmes de gestion et d’archivage du producteur, réalisées dans le cours habituel et ordinaire des affaires en vue d’une action ou pour s’y reporter, peuvent être considérées comme investies de la même autorité et des mêmes effets que la première représentation des documents en question. Les reproductions des documents d’un producteur à des fins de conservation, et non en réponse à des besoins opérationnels, sont considérées comme des copies authentiques parce qu’elles ne sont jamais utilisées dans leur représentation actuelle pour action ou référence par le producteur lui-même. Les documents d’archives du producteur et les copies authentiques sont les mêmes documents mais à des stades différents de leur cycle de vie et donc à des états de transmission différents520. Les premières sont utilisées par le producteur pour atteindre des objectifs métier, alors que les secondes sont créées par les services d’archives à des fins de conservation.
Les copies de documents dans le système de conservation pourront ne pas être déclarées authentiques si le service d’archives les a produites à des fins autres que la conservation ; par exemple, une copie dont les données nominatives ont été supprimées peut être produite à des fins de communication. En dernier recours, seul le service d’archives est habilité à désigner une copie comme authentique.
(A4) Les procédures de conservation des documents d’archives doivent garantir que les composants numériques des documents pourront être maintenus séparément et réassemblés dans le temps. (P2)
Tout document d’archives numérique est constitué d’un ou plusieurs composants numériques. Un composant numérique est un objet numérique qui fait partie d’un ou plusieurs documents numériques, y compris les métadonnées requises pour classer, structurer ou manifester le contenu, et qui requiert une action de conservation donnée. Par exemple, un courriel contenant une image et une signature numérique aura au moins quatre composants numériques (l’en-tête, le texte, l’image et la signature numérique). Un rapport avec des pièces annexes dans différents formats sera constitué de plusieurs composants numériques, alors qu’un rapport enregistré avec ses pièces annexes dans un fichier PDF n’aura qu’un composant numérique. Bien que les composants numériques soient stockés séparément, chaque composant numérique existe dans une relation particulière aux autres composants numériques qui constituent le document.
La conservation des documents d’archives numériques requiert que tous les composants numériques d’un document soient systématiquement identifiés, liés et stockés de telle sorte qu’ils puissent être récupérés et reconstitués en un document ayant la même présentation que lors de sa dernière fermeture. Chaque composant numérique requiert une ou plusieurs méthodes spécifiques pour décoder le train de bits et le présenter en vue de son utilisation dans le temps. Le train de bits peut être modifié, à la suite d’une conversion par exemple, aussi longtemps qu’il reste capable de remplir son rôle initial dans la reproduction du document. Tous les composants numériques doivent être en mesure de fonctionner ensemble après avoir été modifiés ; par conséquent, toutes les modifications doivent être évaluées par le service d’archives afin de déterminer les incidences qu’elles pourraient avoir sur le document.
Le service d’archives doit être prêt à conseiller le producteur, soit directement soit via l’élaboration de standards dont il préconise l’utilisation, sur les types de composants numériques que son système peut accepter. Lorsque les standards gouvernant les types et les formats de composants numériques sont communs aux systèmes de gestion et de records management et au système de conservation, le service d’archives peut encourager le producteur à adopter les standards qui faciliteront le respect des conditions requises de conservation. Lorsqu’il n’existe pas de standards communs ou que leur adoption est trop compliquée, le service d’archives doit connaître le degré d’interopérabilité de certains types et formats de composants numériques. Cela l’aidera à évaluer la capacité du système de conservation à préserver les composants numériques et leurs relations à mesure qu’ils sortiront des systèmes de gestion et de records management du producteur.
Les formats à l’interopérabilité élevée – c’est-à-dire des formats qui ne sont pas attachés à des applications ou des versions d’applications spécifiques – sont généralement considérés comme fournissant une meilleure base au travail de conservation sur le long terme. Il est important, toutefois, de ne pas se focaliser sur l’interopérabilité des formats au détriment des relations entre eux qui doivent également être préservées. Par exemple, une page web en HTML peut être constituée de composants numériques interopérables mais la version de l’encodage HTML utilisée pour structurer les composants peut être une version ancienne comportant de nombreux termes obsolètes (c’est-à-dire des termes qui ne sont pas reconnus par les navigateurs pouvant être utilisés pour reproduire cette page web).
(A5) Les copies authentiques destinées à la conservation ne doivent être faites qu’à partir des documents d’archives du producteur ; c’est-à-dire, à partir d’objets numériques ayant un contenu stable et une forme fixe. (P1)
Adoptant la définition archivistique traditionnelle, InterPARES définit le document d’archives comme un « document produit ou reçu par toute personne physique ou morale et par tout service ou organisme public ou privé, dans l’exercice de leur activité et sélectionné en vue d’une action ultérieure ou à des fins de consultation521. » Selon cette définition, pour être considéré comme un document d’archives, un objet numérique généré par le producteur doit d’abord être un document ; c’est-à-dire, avoir un contenu stable et une forme fixe. Seuls les objets numériques possédant ces deux caractéristiques peuvent remplir la fonction mémorielle du document d’archives.
Le concept de contenu stable parle de lui-même. Il désigne simplement le fait que les données et les informations contenues dans le document (c’est-à-dire le message que le document est destiné à véhiculer) sont intactes et non modifiables. Cela implique que les données ou les informations ne peuvent être ni écrasées, ni modifiées, ni effacées ni augmentées. Ainsi, une organisation dont le système contiendrait des données ou des informations changeantes, qui évoluent constamment, n’a pas de documents d’archives dans ce système tant que quelqu’un ne décide pas d’en créer un et de le conserver avec son contenu immuable.
Le concept de forme fixe est plus complexe. Un objet numérique a une forme fixe lorsque son contenu binaire est stocké de telle sorte que le message qu’il véhicule peut être restitué avec la même présentation documentaire que celle qu’il avait à l’écran la première fois où il a été enregistré. Parce qu’une même présentation documentaire peut être obtenue à partir de plusieurs présentations ou formats numériques, la forme fixe n’implique pas que les trains de bits doivent demeurer inchangés dans le temps. Il est possible de modifier la manière dont un document est contenu dans un fichier informatique sans changer le document ; par exemple, si un objet numérique créé au format .doc est par la suite enregistré en .pdf, la manière dont il est restitué à l’écran – sa présentation documentaire, ou « forme » - n’a pas changé, de sorte que l’on peut dire que l’objet a une forme fixe.
Il arrive également que l’on produise de l’information numérique qui peut prendre plusieurs formes documentaires. Cela signifie que le même contenu peut être présenté à l’écran de différentes manières, ainsi des différents types de graphiques disponibles dans un tableur. Dans ce type de cas, chaque présentation d’un tel objet numérique dans l’éventail limité des possibilités offertes par le système doit être considérée comme une vue différente du même document ayant un contenu stable et une forme fixe.
En outre, il convient de prendre en compte le concept de « variabilité limitée522 », qui désigne les modifications de la forme et/ou du contenu d’un document d’archives numérique qui sont limitées et contrôlées par des règles fixes, de sorte que la même interrogation, requête ou interaction produit toujours le même résultat. Dans ce type de cas, les variations de la forme et du contenu du document sont causées soit par la technologie, par exemple différents systèmes d’exploitation ou applications utilisés pour accéder au document, soit par l’intention de l’auteur ou du rédacteur du document. Pour ce qui est du contenu, alors que, comme cela a été dit, la même requête retournera toujours le même sous-ensemble, sa présentation pourra varier dans des limites autorisées, ainsi de la modification de la taille de l’image. Dans la mesure où ce qui cause ces variations les limite aussi, elles ne sont pas considérées comme contrevenant à la condition requise de contenu stable et de forme fixe.
Dès lors, toute politique de conservation devra clairement indiquer que les reproductions de copies authentiques à des fins de conservation ne peuvent être réalisées qu’à partir des documents du producteur, tels qu’identifiés par le producteur523.
Le service d’archives doit connaître (ou aider à définir) les critères du producteur pour identifier les objets numériques qui sont maintenus comme documents d’archives et les méthodes utilisées pour stabiliser leur contenu et leur forme fixe, puisque, comme cela a été dit, conseiller le producteur sur ses processus et technologies de production fait partie des responsabilités du service d’archives. Cette démarche de conseil permettra également au service d’archives de disposer des informations indispensables pour comprendre les activités et les processus métier à l’origine de la production des documents et d’être en mesure d’évaluer leur identité et leur intégrité dans le temps.
(A6) Les conditions requises de conservation doivent être formulées en fonction de la finalité ou de l’objectif assigné à la conservation, et non en fonction des technologies disponibles. (P3)
Les documents d’archives numériques sont, par nature, tributaires de l’informatique et toute représentation d’un document d’archives existe dans un certain environnement technologique. Dès lors, on pourra être tenté de définir les conditions requises de conservation des documents suivant leurs caractéristiques technologiques ou les systèmes dont ils dépendent. Mais les technologies évoluent, parfois très rapidement, et elles sont en outre gouvernées par des considérations établies et modifiées à leur gré par leurs développeurs. Ces deux facteurs peuvent avoir de lourdes conséquences sur l’accessibilité des documents dans le temps. C’est pourquoi il est fortement déconseillé de faire référence à des technologies données dans les politiques et les normes de conservation des documents d’archives. Seules les conditions requises et les obligations que les documents doivent remplir sont mentionnées dans les politiques et les normes de conservation. C’est seulement au niveau de la mise en œuvre que des technologies peuvent et doivent être nommément désignées.
Les solutions technologiques de conservation des documents d’archives sont dynamiques, ce qui signifie qu’elles évolueront au rythme des technologies. Concrètement, cela signifie deux choses pour la conservation des documents. Premièrement, de nouvelles politiques pourront être adoptées pour répondre aux besoins de conservation, comme cela s’est produit avec l’utilisation du XML pour la conservation sur le long terme de documents structurés. Deuxièmement, cela crée des opportunités de s’appuyer sur les connaissances et le savoir-faire de diverses disciplines. Les deux questions sont liées. Ainsi, bien que l’utilisation du XML ne soit, en tant que telle, qu’une activité de conservation, on l’associe par exemple à la technologie des grilles de données comme plateforme stable et durable de support des documents XML. Ainsi, de nouvelles connaissances archivistiques continueront à émerger et à être requises.
Pour être efficaces, les solutions technologiques doivent aussi être spécifiques. Bien que la théorie et la méthodologie générales de la conservation numérique s’appliquent à tous les documents d’archives numériques, les solutions de conservation pour les différents types de documents requièrent différentes méthodes. Celles-ci doivent être fondées sur le contexte dans lequel les documents sont produits et maintenus, les fonctions et les activités auxquelles ils participent et les technologies employées pour leur production et leur archivage, afin de garantir que les meilleures solutions soient élaborées pour conserver chaque type de document.
Les politiques de conservation formulées en fonction des conditions requises pour les documents, et non de technologies, seront plus stables, ne nécessitant d’être mises à niveau que si ces conditions évoluent, et non au gré des changements technologiques. Les plans de conservation devront vraisemblablement être mis à jour plus fréquemment afin d’identifier les solutions technologiques adaptées à la conservation numérique d’ensembles spécifiques de documents. Une veille devra être effectuée sur les solutions identifiées afin, le cas échéant, de les modifier et de les mettre à jour.
(A7) Les considérations sur la conservation doivent être intégrées à toutes les activités de chaque phase du cycle de vie des documents d’archives si l’on veut garantir leur authenticité sur le long terme. (P7)
En archivistique, le concept de cycle de vie du document d’archives renvoie à la théorie selon laquelle les documents d’archives passent par différents stades, à savoir : production, utilisation et maintenance, et sort final (c’est-à-dire, leur destruction ou leur conservation définitive).
Il est essentiel que les services d’archives qui prennent en charge des documents numériques comprennent que, à la différence de ce qui prévaut avec les documents traditionnels, la conservation est un processus ininterrompu qui débute dès la production des documents. Les documents analogiques sont évalués au stade du sort final, lorsqu’ils ne sont plus requis par le producteur pour la conduite de ses activités. Avec les documents d’archives numériques, les décisions relatives au sort final doivent être prises le plus près possible du stade de production du fait de la facilité et de la rapidité avec lesquelles les objets numériques peuvent être manipulés, effacés par accident ou intentionnellement, ou perdus à cause de l’obsolescence technologique.
Dès lors que l’on considère que la conservation des documents commence dès leur production, il convient que les considérations sur la conservation soient prises en compte et intégrées dans la conception des systèmes de gestion et d’archivage des documents. Chaque ensemble de documents ayant été évalué doit être identifié conformément au plan de classement et au tableau de gestion définis par le producteur en collaboration avec le service d’archives, et cette identification doit apparaître dans les métadonnées des documents. Les documents ainsi identifiés doivent être surveillés par le service d’archives tout au long de leur cycle de vie de façon à ce que les résultats de l’évaluation puissent être actualisés en fonction de tout changement qui interviendrait après leur production. Les résultats de l’évaluation archivistique doivent être réexaminés pour s’assurer que les informations concernant les documents sont toujours valides, que des modifications des documents et de leur contexte n’ont pas eu d’effets négatifs sur leur identité ou leur intégrité, et que les modalités de leur sort final sont toujours réalisables et applicables aux documents. Pour ce faire, le service d’archives désigné doit disposer d’un accès continu au système d’archivage du producteur dans les limites convenues avec ce dernier, telles que définies par les droits d’accès étendus du service d’archives. Le service d’archives doit mettre en place des procédures afin de faciliter l’interaction permanente avec le producteur des documents.
(A8) Les droits de propriété intellectuelle tiers attachés aux documents d’archives du producteur doivent être explicitement identifiés et gérés dans le système de conservation. (P10)
Les services d’archives savent que les documents détenus par les producteurs contiennent des informations tombant sous le coup du droit de la propriété intellectuelle. Ils doivent également avoir conscience que dans certains cas, les droits de propriété intellectuelle associés à un document appartiennent à un tiers autre que l’auteur ; c’est-à-dire que les droits de propriété intellectuelle appartiennent à une tierce partie. Les droits de propriété intellectuelle tiers doivent être mentionnés dans les métadonnées associées aux documents parce qu’ils ont des incidences sur les processus de rafraîchissement, de conversion et de migration des documents en vue de leur utilisation continue ou à des fins de conservation. Sujette à des variations d’un environnement juridique à l’autre, la reproduction de documents assortis de droits de propriété intellectuelle détenus par des tiers peut contrevenir à la législation qui protège ces droits. En ce qui concerne les documents sélectionnés pour être conservés sur le long terme, l’obtention des autorisations nécessaires doit être explicitement abordée avec le producteur.
Parce que la conservation dans un environnement numérique nécessite de réaliser des copies, les droits de propriété intellectuelle sont un enjeu central, non seulement pour l’accès aux documents, comme par le passé, mais également pour leur conservation. Il est de la responsabilité du service d’archives de : premièrement, conseiller le producteur sur la façon de prendre en compte et de gérer les droits de propriété intellectuelle dans ses systèmes de gestion et d’archivage des documents ; et, deuxièmement, de veiller à ce que ces questions soient prises en compte dans la conception du système de conservation. En particulier, toute question liée aux droits de propriété intellectuelle tiers devra être résolue avant le versement des documents au service d’archives. Ce dernier doit considérer ces questions comme faisant partie de l’évaluation de la faisabilité de la conservation.
(A9) Les droits et obligations relatifs aux données à caractère personnel attachés aux documents d’archives du producteur doivent être explicitement identifiés et protégés dans le système de conservation. (P11)
La législation sur les données à caractère personnel protège les droits des individus relativement aux données à caractère personnel pouvant être contenues dans tout document utilisé et maintenu par un producteur avec qui ils ont des interactions. Les limites de cette protection dépendent du cadre juridique dans lequel opère le producteur. Ce cadre juridique peut entrer en conflit avec la politique de communicabilité liée à la mission du producteur et même avec la législation sur l’accès à l’information dans le même système juridique. Outre de militer en faveur d’exceptions, le service d’archives désigné devra veiller à ce que soient clairement comprises les implications de la situation existante pour la conservation et la communicabilité des documents.
La présence d’informations à caractère personnel dans les documents doit être constatée et documentée dans les métadonnées associées aux documents dans les systèmes de gestion et d’archivage des producteurs. Les schémas de métadonnées qui constatent et administrent l’utilisation des données à caractère personnel contenues dans les documents doivent être intégrés aux systèmes de gestion et d’archivage des documents. C’est le meilleur moyen de garantir que les documents seront gérés dans le respect de la législation sur la protection des données à caractère personnel et que le service d’archives désigné pourra inclure ces questions dans l’étude de faisabilité menée dans le cadre de l’évaluation archivistique. En tant qu’archiviste tiers de confiance, le service d’archives désigné pour chaque producteur de documents devrait être autorisé à accéder aux documents contenant des données à caractère personnel afin d’accomplir les activités de conservation. Le traitement archivistique de données à caractère personnel aux fins de conservation des documents est à distinguer de leur utilisation à des fins de recherche ou à des fins commerciales. Indépendamment du cadre juridique, le producteur et le service d’archives désigné doivent être en mesure de démontrer que le traitement archivistique des documents contenant des données à caractère personnel n’expose pas ces données à des accès non autorisés.
Les services d’archives doivent également faire leur possible pour faire admette l’idée que ce sont le producteur et ses successeurs légitimes qui doivent être investis de la responsabilité du traitement des documents contenant des données à caractère personnel en vue de leur conservation. Bien que, dans la plupart des pays, la législation sur la protection des données à caractère personnel autorise et encadre la sous-traitance de ces activités à des sociétés spécialisées, il est recommandé d’éviter dans la mesure du possible de recourir à cette pratique afin de limiter le nombre d’individus autorisés à accéder à et/ou traiter les documents, réduisant par là même le risque de divulguer des informations personnelles contenues dans les documents et de compromettre la capacité d’obtenir l’autorisation de traiter des données à caractère personnel à des fins de maintenance ou de conservation.
Dans le cas de documents d’archives n’ayant pas encore été désignés pour la conservation définitive, les décisions sur leur sort final devraient être prises avant l’expiration du mandat initial autorisant le traitement des données à caractère personnel, ceci afin de garantir que les conditions juridiques pour conserver ces documents soient toujours réunies.
(A10) L’évaluation archivistique doit identifier et analyser tous les processus métier qui contribuent à la production et/ou l’utilisation des mêmes documents d’archives. (P9)
Il arrive qu’un document créé à une certaine fin soit par la suite utilisé à d’autres fins par différentes personnes. Toute décision concernant la durée de conservation et le sort final des documents doit prendre en compte toutes les utilisations du document et connaître les processus métier qui les sous-tendent. C’est indispensable pour prendre une décision motivée quant aux documents qu’il convient de conserver et pouvoir gérer avec efficacité toutes les copies des documents qui n’ont pas été retenus pour conservation.
L’utilisation de documents, ou d’informations à l’intérieur de documents, par plusieurs processus métier peut être souhaitable du point de vue du producteur en ce que cela renforce l’interopérabilité de ses systèmes d’information et de gestion documentaire. Dans ce type de situations, le service d’archives doit indiquer au producteur que les métadonnées associées aux documents utilisés par plusieurs processus métier doivent identifier chaque processus métier concerné. C’est fondamental pour le producteur parce que cela garantit l’authenticité des documents en établissant leur identité et leur intégrité dans chaque contexte. C’est également fondamental pour le service d’archives qui doit connaître tous les contextes dans lesquels les documents ont été utilisés afin de conduire une évaluation efficace et aussi satisfaire aux conditions de base requises pour maintenir l’authenticité de tout document acquis dans le système de conservation.
(A11) L’évaluation archivistique doit évaluer l’authenticité des documents d’archives. (P6)
Les décisions concernant la durée de conservation et le sort final des documents doivent être prises en réunissant des informations sur les documents et leur(s) contexte(s), en évaluant leur valeur et en déterminant la faisabilité de leur conservation524.
Dans le cadre de l’évaluation de la valeur des documents, les services d’archives doivent établir les fondements soutenant la présomption d’authenticité des documents en cours d’évaluation. Cela signifie que les services d’archives doivent garantir que l’identité de chaque document a été documentée et maintenue telle quelle et qu’ils doivent établir à quel degré le producteur des documents a garanti leur intégrité, en veillant à ce que ses documents soient intacts et non corrompus. Les éléments à l’appui de la présomption d’authenticité doivent être évalués par rapport aux Conditions de référence requises d’InterPARES525.
(A12) La description archivistique doit être utilisée comme authentification collective des documents d’un fonds d’archives. (P6)
La description archivistique d’un fonds repose sur l’analyse exhaustive des diverses relations tissées au cours de l’élaboration et de l’accumulation des documents et constitue par conséquent le moyen le plus fiable d’établir la continuité d’authenticité d’un ensemble de documents liés. Alors que l’authenticité de documents individuels peut être en partie établie grâce à leurs métadonnées, seule la description archivistique peut prouver l’authenticité d’un groupe de documents (un dossier, une série organique ou un fonds).
La fonction, implicite ou explicite, de la description archivistique a toujours été d’authentifier les documents en perpétuant leurs relations administratives et documentaires ; mais avec les documents numériques, cette fonction est passée au premier plan. De fait, à mesure que disparaissent les documents numériques originaux et que leur succède une chaîne interminable de reproductions non identiques, les chercheurs en quête de la dernière de ces reproductions n’y trouveront aucune information concernant la provenance, l’autorité, le contexte ou l’authenticité du document.
La fonction d’authentification de la description archivistique est différente de celle d’un certificat d’authenticité parce que ce n’est pas seulement une attestation de l’authenticité des documents pris un à un, mais une attestation collective de l’authenticité des documents d’un fonds et de toutes leurs relations telles qu’elles transparaissent dans leur histoire administrative, l’histoire de leur conservation et leur histoire technologique (et notamment la description du ou des systèmes d’archivage où ils ont été maintenus et utilisés), ainsi que dans leur contenu, leur portée et la représentation hiérarchisée des ensembles ainsi constitués. Elle est également différente des métadonnées d’identification et d’intégrité associées à chaque document, qui font partie du document lui-même et sont reproduites avec lui, et des métadonnées additionnelles associées aux ensembles de documents (séries, dossiers par exemple) dans le système d’archivage pour les identifier et décrire leurs transformations technologiques.
La fonction unique de la description archivistique est de fournir une vue historique des documents et de leur devenir, tout en les présentant comme un tout dans lequel la spécificité de chaque membre est assujettie au lien d’une provenance et d’une destination communes.
(A13) Les procédures d’accès aux documents dans d’autres systèmes juridiques que celui où ils ont été produits doivent être définies sur la base de l’environnement juridique dans lequel les documents d’archives ont été produits. (P12)
Différents systèmes juridiques peuvent avoir des lois et des réglementations différentes en ce qui concerne l’accès aux documents afin de protéger les données à caractère personnel, la propriété intellectuelle et tout autre type d’intérêts publics ou privés (par exemple, documents contenant des informations sensibles). Les services d’archives qui font partie d’une organisation productrice (par exemple, des services d’archives internes) ayant des filiales relevant de différentes législations doivent savoir ce que cela implique en termes de partage et d’échange de documents. En effet, cette pluralité de systèmes juridiques aura des conséquences sur l’accessibilité et la communicabilité des documents tant au sein de l’organisation qu’à l’extérieur de celle-ci.