École des chartes » ELEC » InterPARES 2 » Annexe 2 Le concept de document d’archives dans les environnements interactifs, expérientiels et dynamiques : le point de vue d’InterPARES

Annexe 2
Le concept de document d’archives dans les environnements interactifs, expérientiels et dynamiques : le point de vue d’InterPARES412

Résumé. Cet article présente le concept de document d’archives électronique tel qu’il avait été formulé durant la première phase du projet InterPARES (International research on Permanent Authentic Records in Electronic Systems – recherche internationale sur les documents authentiques pérennes dans les systèmes électroniques) (1999-2001), pour le réexaminer à la lumière des conclusions de la deuxième phase du projet (2002-2006). Alors que les travaux d’InterPARES 1 portaient sur les documents produits et/ou maintenus dans des bases de données et des systèmes de gestion documentaire, InterPARES 2 s’est intéressé aux documents d’archives produits et/ou maintenus dans des environnements interactifs, expérientiels et dynamiques. Les auteurs décrivent les caractéristiques de ces environnements et des entités qui ont pu y être observées au cours d’études de cas portant sur les systèmes utilisés dans le cadre d’activités artistiques, scientifiques et d’administration électronique, et présentent le nouveau concept de document d’archives en cours d’élaboration par InterPARES 2, qui prolonge celui formulé par InterPARES 1.

Mots clés : archivistique, art électronique, concept de document d’archives, documents d’archives numériques, diplomatique, documents de l’administration électronique, systèmes dynamiques, systèmes électroniques, systèmes expérientiels, systèmes interactifs

Le but du projet InterPARES (International research on Permanent Authentic Records in Electronic Systems – Recherche internationale sur les documents authentiques pérennes dans les systèmes électroniques) est de développer les connaissances théoriques et méthodologiques essentielles à la conservation sur le long terme de documents d’archives authentiques produits et/ou maintenus sous forme numérique. Ces connaissances serviront de base à l’élaboration de politiques, de stratégies et de normes garantissant la pérennité de ce type de documents, ce qui permettra aux utilisateurs d’avoir confiance en leur authenticité. Le projet s’est déployé en deux phases. La première, InterPARES 1, qui a débuté en 1999 et s’est achevée en 2001, portait sur les documents créés dans des bases de données et des systèmes de gestion documentaire. Les travaux d’InterPARES 2, qui ont débuté en 2002 et s’achèveront en 2006414, se concentrent quant à eux sur cette part de la mémoire de nos sociétés qui est produite sous forme numérique dans des systèmes interactifs, dynamiques et expérientiels et résulte d’une activité artistique, scientifique ou d’administration électronique415. Les caractéristiques nouvelles et spécifiques des environnements étudiés dans InterPARES 2 obligent à réexaminer les conclusions d’InterPARES 1, en particulier l’interprétation qui avait été faite des concepts archivistiques traditionnels, à commencer par celui de document d’archives. Les éléments de réflexion proposés dans le présent article le sont à titre individuel par deux chercheurs de l’équipe d’InterPARES 2 et doivent être considérés comme une contribution au travail mené au sein du groupe et non comme un produit définitif du projet.

Cet article explore les caractéristiques de documents appartenant à des systèmes interactifs, dynamiques et expérientiels, tels qu’observés au cours des études de cas conduites dans le cadre du projet InterPARES et d’autres travaux, en vue de déterminer s’ils sont ou peuvent être des documents d’archives et, dans l’affirmative, s’ils présentent des caractéristiques spécifiques qui pourraient conduire à réviser le concept traditionnel de document d’archives. L’analyse de ces caractéristiques s’appuie sur la définition archivistique du « document d’archives » et plus particulièrement sur la formulation qui en a été donnée dans InterPARES 1416.

Cette analyse est divisée en cinq sections. La section 1 présente les principales conclusions d’InterPARES 1 intéressant le propos du présent article. La section 2 décrit les environnements interactifs, expérientiels et dynamiques et ce qu’ils impliquent pour les documents d’archives qui y sont produits ou reçus et/ou conservés. La section 3 s’intéresse plus particulièrement aux « documents » qui sont ou pourraient être créés dans ce type d’environnements. La section 4 envisage les « documents d’archives » qui sont ou pourraient être produits ou reçus et/ou conservés dans ces environnements. La section 5 s’interroge sur la conservation de tels documents d’archives. Enfin, une section conclusive synthétise les principaux résultats de l’analyse.

Les conclusions d’InterPARES 1

Au début des travaux d’InterPARES 1, l’équipe de recherche a adopté un concept et une définition pour les termes « document d’archives », « document », « information » et « donnée », qu’elle a ensuite utilisés pour qualifier les objets numériques observés lors des études de cas. L’équipe a retenu la définition archivistique traditionnelle du document d’archives : tout document créé (c’est-à-dire, produit ou reçu et sélectionné – c’est-à-dire, conservé, gardé – en vue d’une action ultérieure ou à des fins de consultation) par toute personne physique ou morale, et par tout service ou organisme public ou privé, dans l’exercice de leur activité. L’équipe a défini un « document » comme une information enregistrée, une « information » comme un message destiné à être communiqué à travers l’espace ou le temps, et une « donnée » comme la plus petite unité d’information signifiante. Enfin, un « document d’archives numérique » a été défini comme un document d’archives conservé et utilisé sous forme électronique indépendamment de la forme originale dans laquelle il a pu être produit ou reçu. Les choix d’InterPARES 1 étaient en parfaite cohérence avec le principe archivistique selon lequel tout ce que le producteur traite comme un document d’archives dans le cours d’une action donnée quelle qu’elle soit est bien un document d’archives dans le contexte de cette action. Ils marquaient en outre que ce qui différencie un document d’archives d’un document qui ne l’est pas est la nature de sa relation avec l’activité du producteur, plutôt que ses caractéristiques formelles ou intellectuelles.

Ayant ainsi posé la définition du document d’archives, les chercheurs d’InterPARES 1 en ont exploré les présupposés et les implications en déterminant quelles sont les caractéristiques nécessaires d’un document d’archives numérique au regard de l’archivistique et de la diplomatique, ces deux sciences étant considérées comme complémentaires l’une de l’autre. En effet, alors que la diplomatique étudie les documents en tant que pièces, permettant l’identification de leurs caractéristiques intrinsèques, la théorie archivistique, en traitant les documents comme des parties d’ensembles plus larges, étudie leurs relations avec d’autres documents, les personnes impliquées dans leur production et les activités au cours desquelles ils sont créés et utilisés. L’équipe de recherche a identifié les caractéristiques nécessaires suivantes : (1) une forme fixe, signifiant par là que le contenu de l’objet doit être stocké de telle façon qu’il demeure complet417 et non altéré, et que son message puisse être restitué avec la même forme documentaire que celle qu’il avait la première fois où il a été sélectionné ; (2) un contenu non modifiable418 ; (3) des liens explicites avec d’autres documents d’archives dans ou à l’extérieur du système, exprimés par un code de classement ou tout autre identifiant unique419 ; (4) un contexte administratif identifiable ; (5) un auteur, un destinataire et un rédacteur ; et (6) une action, à laquelle participe le document d’archives ou qu’il étaye soit au niveau de la procédure soit en tant qu’élément du processus de décision420.

Une fois précisées les caractéristiques nécessaires du document d’archives numérique, l’équipe de recherche a retenu comme hypothèse de travail le présupposé fondamental de la diplomatique selon lequel, indépendamment des différences de nature, de provenance ou de date, d’un point de vue formel, tous les documents sont suffisamment similaires pour qu’il soit possible d’imaginer une forme documentaire type, idéale, contenant tous les éléments possibles d’un document d’archives. De cette hypothèse, découlent deux corollaires : bien qu’ils puissent se manifester de manières différentes, les éléments formels présents dans les documents traditionnels existent dans les documents numériques implicitement ou explicitement ; et tous les documents d’archives numériques partagent les mêmes éléments formels. L’équipe a ainsi pu élaborer un modèle, soit une décomposition du document numérique électronique idéal, d’abord en ses éléments constitutifs, puis, pour l’élément « forme », en ses caractères421. Dans le modèle, les éléments et caractères sont définis et leur finalité expliquée. L’équipe de recherche a utilisé ce modèle pour analyser les objets numériques contenus dans différents systèmes, en vue de déterminer lesquels sont des documents d’archives.

Le modèle comporte quatre sections qui correspondent aux quatre composants que doit contenir tout document d’archives : forme documentaire, additions, contexte et support422. La forme documentaire423 possède des caractères internes et des caractères externes. Les caractères internes424 sont le nom des personnes concourant à la création du document, la date, le lieu de provenance du document, la mention et la description de l’action ou de l’affaire, les marques de validation ; et les caractères externes425 : les caractéristiques de présentation générale (par exemple, texte, image, son, graphique), les caractéristiques de présentation particulières (mise en page, hyperliens, couleurs, fréquence d’échantillonnage des fichiers sonores, résolution des fichiers images, échelle des cartes par exemple), les signatures et sceaux électroniques (signatures numériques par exemple), l’horodatage et les signes de validation (filigranes numériques, tampons et logos d’organisations et de personnes)426.

Les additions se répartissent en trois grands groupes : (1) ajouts faits au document après sa création dans le cadre de sa transmission (par exemple, niveau de priorité de la transmission, date d’élaboration et date de transmission dans un courriel, indication des pièces jointes), (2) ajouts faits au document au cours du traitement de l’affaire à laquelle il participe (par exemple, date et heure de réception, action engagée, nom du service métier), et (3) ajouts faits au document dans le cadre de sa gestion en tant que document d’archives (par exemple, date de classement, code de classement, numéro d’enregistrement). Les contextes du document d’archives427, et les éléments à travers lesquels ils se manifestent, sont classés selon une logique qui va du général au particulier : (1) le contexte juridico-administratif (lois et réglementations), (2) le contexte de provenance (organigrammes, rapports annuels, tables d’utilisateurs dans une base de données), (3) le contexte procédural (règles de workflow, codes de procédure interne), (4) le contexte documentaire (plans de classement, inventaires, index, registres), et (5) le contexte technologique (par exemple, matériel, logiciels informatiques, modèles conceptuels, administration du système)428.

Le support429 a été difficile à positionner dans le modèle. En effet, bien qu’il demeure nécessaire pour qu’un document d’archives électronique existe, il n’est plus inextricablement lié au message, ne stocke pas le document en tant que tel mais un ou plusieurs flux de données binaires qui peuvent être utilisés pour reproduire le document, et le choix de tel ou tel support par le producteur ou celui qui conserve le document peut être arbitraire ou répondre à des motifs relatifs à la conservation, et n’est donc pas nécessairement lié à la fonction du document. Qui plus est, le support n’est pas un facteur pertinent pour évaluer l’authenticité d’un document – un des premiers objectifs d’InterPARES -, à tout le moins du point de vue de celui qui produit et/ou conserve le document430. Cela a été confirmé par les études de cas dont les résultats ont convaincu l’équipe de recherche que, dans le cas des documents numériques, le support ne doit pas être considéré comme un élément constitutif du document mais comme un élément de son contexte technologique.

Si le support apparaît comme une considération secondaire pour le document numérique, il n’en demeure pas moins que la façon dont celui-ci est organisé et stocké dans un ou plusieurs trains de bits joue un rôle analogue à celui du support pour les documents analogiques. Certaines séquences binaires sont nécessaires pour reproduire le document numérique et exigent des mesures de conservation spécifiques. L’équipe de recherche a défini ces séquences comme les composants numériques du document d’archives numérique. Dans le cas des documents analogiques, le choix du support est fonction des caractéristiques de présentation générale du document : un document textuel peut être « enregistré » sur papier, un document audio non. L’organisation du document numérique en un ou plusieurs composants numériques dépend quant à elle du format d’encodage des données du document. Un « format d’encodage des données » est un jeu de valeurs binaires utilisé pour encoder des données. Les données textuelles peuvent être encodées en ASCII, mais pas les données audio. L’authenticité d’un document analogique peut être maintenue même lorsqu’il est copié d’un support physique sur un autre, pourvu que le support de remplacement soit adéquat ; par exemple, des documents textuels consignés à l’origine sur papier peuvent être conservés sous forme de copies authentiques sur microfilm. De même, l’authenticité des documents numériques peut-elle être préservée même lorsqu’il y a transformation d’un jeu de composants numériques en un autre, sous réserve que ce dernier préserve tous les attributs essentiels du document.

L’exploration du concept de composant numérique découle du constat qu’il n’est pas possible de conserver un document numérique comme un document papier. Un document numérique est un objet restitué à partir d’un système informatique, le plus souvent sur un écran, lorsqu’un être humain en a besoin ou lors d’interactions entre systèmes. Il ne peut pas être stocké dans la forme dans laquelle il est visualisé ou utilisé431, sauf à être converti en une forme analogique à l’extérieur du système, mais alors, ce ne serait plus un document numérique. Il est stocké sous forme d’une ou plusieurs séquences de bits qui doivent être traitées par un ordinateur pour être à nouveau visualisées ou utilisées en tant qu’unité. L’équipe de recherche a ainsi établi, empiriquement, que conserver un document numérique consiste à conserver la capacité de le reproduire. Un système qui conserve des documents numérique doit être capable d’identifier et de localiser tous les composants numériques de chaque document et d’appliquer le logiciel adéquat à chaque composant pour reproduire le document.

Les composants numériques peuvent contenir tout ou partie d’un document numérique, et/ou les métadonnées qui lui sont associées. Par exemple, un courriel contenant un message textuel, une photo et une signature numérique a au moins quatre composants numériques : les données de l’en-tête, qui permettent aux systèmes d’acheminer et de gérer correctement le message, le texte du message, la photo et la signature numérique. En revanche, un rapport avec quatre pièces jointes de texte pourrait être constitué d’un seul fichier « .pdf » (c’est-à-dire, un seul composant numérique) mais il pourrait tout aussi bien être constitué d’un fichier de traitement de texte contenant le corps du rapport, et de quatre autres fichiers, vraisemblablement dans d’autres formats, pour les pièces jointes (soit cinq composants numériques au total). La conservation sous forme numérique a ceci de particulier et d’important qu’il est possible de préserver la capacité de reproduire un document numérique même lorsque ses composants sont modifiés. Un rapport composé de cinq fichiers de traitement de texte pourrait être combiné en un seul fichier, puis converti en « .pdf ». Pourvu qu’un lecteur « .pdf » restitue fidèlement le même document que ce qui aurait été affiché par le logiciel de traitement de texte original pour les cinq fichiers de départ, peu importe que l’encodage du document en composants numériques soit passé de cinq fichiers à un fichier et d’un format de traitement de texte à un « .pdf ».

Enfin, l’équipe d’InterPARES 1 a éprouvé le besoin de souligner que, la relation entre un document d’archives numérique et un fichier informatique étant éminemment variable (un document pour un fichier, un pour plusieurs, plusieurs pour un ou plusieurs pour plusieurs), nous ne devons jamais utiliser de façon interchangeable les termes « document d’archives » et « fichier » ; que la même présentation432 d’un document pouvant être obtenue à partir de divers fichiers numériques, et inversement, qu’un fichier numérique pouvant dériver de différentes représentations du document, la forme fixe n’implique donc pas que les trains de bits doivent rester intacts au fil du temps ; et que, puisqu’il est possible de modifier la façon dont un document est contenu dans un fichier informatique sans modifier le document, le nom de la forme documentaire433 d’un document d’archives n’indique pas nécessairement à quel objet numérique nous avons affaire.

L’analyse des études de cas conduites en utilisant le modèle a montré qu’environ la moitié seulement des systèmes étudiés contenaient des documents d’archives (12 sur 22), les objets identifiés dans les autres systèmes ne semblant pas posséder de forme documentaire fixe ou de contenu stable. Lorsque les systèmes contenaient bien des documents d’archives, leur piètre qualité rendait problématique toute comparaison avec le modèle. Par exemple, dans la plupart des systèmes observés, il n’y avait pas d’indication explicite de la relation entre les documents participant à la même affaire et, même s’il était aisé d’identifier les processus métier supportés par le système, il n’était pas toujours possible de déterminer comment les documents participaient à des actions spécifiques. En outre, il était souvent difficile d’évaluer la portée de la présence ou de l’absence de certains éléments de la forme documentaire ou des additions.

Plus important, les études de cas ont montré que, pour les documents numériques, un concept clé à prendre en compte est celui des attributs du document, c’est-à-dire les propriétés fondamentales d’un document donné ou d’un de ses caractères. Un caractère du document d'archives est un élément constitutif de sa forme documentaire et, comme nous l’avons vu précédemment, il peut être externe, comme un sceau, ou interne, comme le salut434. Un attribut peut se manifester dans un ou plusieurs caractères du document. Par exemple, le nom de l’auteur d’un document est un attribut, qui peut être exprimé à travers un en-tête ou une signature, tous deux étant des caractères internes de la forme documentaire, c’est-à-dire, des caractères du document d’archives. Outre les attributs qui se manifestent dans la forme du document, c’est-à-dire dans son apparence, comme les caractères, tout document d’archives possède des attributs qui sont implicites ailleurs, ainsi du nom du producteur ou du support. Dans les documents d’archives numériques, toutefois, ils sont explicites bien qu’exprimés à l’extérieur de la forme documentaire. Ils sont la plupart du temps transparents pour l’utilisateur, parce qu’ils se manifestent comme des métadonnées incluses dans un profil de document435, un autre objet numérique lié au document ou une documentation concernant le système ou l’application où le document est produit. Les attributs rendus explicites à l’extérieur du document, sous forme de métadonnées établissant son identité, sont importants pour identifier de manière unique tout document numérique mais sont essentiels à l’identification d’objets numériques qui n’ont pas – ou tant qu’ils n’ont pas – un contenu stable ou une forme fixe.

Le concept de document d’archives numérique présenté ci-dessus, assorti de ses caractéristiques, éléments, caractères formels, attributs et composants numériques, a très bien fonctionné avec les bases de données et les systèmes de gestion des documents. Il peut toutefois sembler moins satisfaisant lorsqu’on l’applique aux objets étudiés par InterPARES 2, parce que la fluidité fait partie de leur nature et participe à l’accomplissement de leur finalité en tant qu’instruments ou supports d’une action.

Les environnements interactifs, expérientiels et dynamiques

InterPARES 2 a conduit des études de cas dans les domaines des arts436, des sciences et de l’administration électronique, en ayant soin de sélectionner des initiatives illustrant un usage innovant des technologies numériques. Cette approche permet en particulier au projet de déterminer si les documents produits dans des environnements qui n’existent que dans la sphère numérique sont de nature différente. Aux fins d’engager son exploration des nouvelles technologies, InterPARES 2 a, dans un premier temps, adopté la définition de « système interactif » proposée par l’Institute of Electrical and Electronics Engineers (IEEE) : « [système] dans lequel chaque entrée de l’utilisateur provoque une réponse ou une action du système »437. L’éventail des systèmes interactifs est large. Dans les plus simples, les entrées de l’utilisateur sont limitées à un nombre donné de choix et les réponses du système suivent des chemins fixes à partir de ces choix. Des situations plus complexes surviennent lorsque le nombre et la variété des interactions possibles sont tellement élevés qu’il est quasiment impossible de prévoir les résultats. Dans des cas plus complexes encore, l’entrée de l’utilisateur peut à son tour devenir une donnée ou en générer de nouvelles qui sont incluses dans les sorties ultérieures. Les systèmes étudiés par InterPARES 2 mettent en jeu des séquences plus complexes et moins prévisibles d’interactions avec les utilisateurs et les applications ; ainsi, dans l’Electronic Cafe International438, un réseau multimédia international d’expériences artistiques et informatiques, les actions ou les réponses sont déclenchées par les instructions d’autres systèmes.

Il existe une catégorie très étendue d’applications où un système réalise des transactions individuelles en agissant non pas simplement comme une machine mais comme un agent pour le propriétaire du système. On citera par exemple les systèmes utilisés pour les transferts de fonds électroniques entre institutions financières ou encore par les distributeurs automatiques de billets (DAB). Ce type de système produit, pour la banque ou une autre institution financière, le document numérique d’un retrait, dépôt ou virement, et ce, sans aucune participation physique, en temps réel, d’un responsable ou d’un employé de la banque439. Ces systèmes reçoivent également des documents émis par d’autres systèmes, par exemple lorsque le DAB d’une institution enregistre une transaction réalisée sur un compte bancaire domicilié dans une autre institution440. Le système récepteur accomplit par la suite automatiquement d’autres actions, ajuster les soldes des comptes et produire des rapports ou d’autres documents rendant compte de ces transactions, par exemple.

À la lumière de ces exemples, il convient de proposer une définition plus étendue du système interactif : « [un système] dans lequel chaque entrée de l’utilisateur ou instruction d’un autre système provoque une réponse ou une action du système. »

Dans le cas des systèmes expérientiels également, l’équipe d’InterPARES 2 a souhaité s’appuyer sur une définition qui servirait de référence pour la sélection des études de cas. Il a été décidé d’utiliser la notion proposée par Clifford Lynch, selon laquelle les objets numériques expérientiels sont des objets dont la nature dépasse les trains de bits qui les constituent pour englober le comportement du système de restitution, ou au moins l’interaction entre l’objet et le système de restitution441. Cette définition, toutefois, s’est révélée de peu d’utilité pour déterminer si tel ou tel système informatique, et les documents qui y sont produits, peuvent être qualifiés ou non d’expérientiels. Pour leur part, les chercheurs d’InterPARES ont défini les systèmes expérientiels comme des systèmes qui immergent l’utilisateur dans une expérience sensorielle. Il faut cependant noter que ce concept renvoie à un sous-ensemble de l’informatique expérientielle décrite par Ramesh Jain, qui, outre les expériences subjectives – écouter une histoire, effectuer des travaux collaboratifs ou vivre un événement personnel -, identifie des applications expérientielles utilisées à des fins administratives ou de recherche, par exemple, le suivi de l’activité d’une entreprise, la sécurité du territoire ou la bio-informatique. Pour Jain, dans l’informatique expérientielle, la sensation enrichit la cognition :

« [Les utilisateurs] doivent pouvoir explorer et vivre les événements depuis plusieurs perspectives et les revisiter aussi souvent que nécessaire pour parvenir à cette perception. Dans un environnement informatique expérientiel, les utilisateurs exercent directement leurs sens, observant les données et les informations liées aux événements qui les intéressent. Qui plus est, les utilisateurs explorent les données en suivant leurs propres centres d’intérêt à l’intérieur du contexte d’un événement.

« Les environnements expérientiels libèrent les utilisateurs du pensum d’avoir à gérer des volumes énormes de données hétérogènes disparates. Ils n’essayent pas d’interpréter une expérience ; ils fournissent un environnement qui peut être utilisé pour comprendre naturellement les événements442. »

Dans cette conception, les environnements expérientiels sont nécessairement interactifs mais au lieu de répondre à des options préprogrammées, les interactions sont déterminées par les centres d’intérêt de l’utilisateur lui-même, et ils offrent généralement aux utilisateurs des possibilités d’interactions avec le système bien plus riches que les systèmes interactifs non expérientiels. Cette conception s’annonce plus prometteuse que les définitions adoptées jusqu’ici par InterPARES.

Enfin, pour ce qui est des environnements dynamiques, l’équipe d’InterPARES les avait dans un premier temps définis comme « dépendants de données pouvant avoir des valeurs variables et être détenues dans des bases de données et des feuilles de calcul », faisant sienne la conception de l’informatique dynamique de Seamus Ross443. Cependant, dans le cours des recherches conduites en vue de cet article, il est apparu que le caractère dynamique est un attribut attaché à de nombreux environnements :

« L’expression informatique dynamique est utilisée pour décrire des approches flexibles et adaptables de modulation des ressources informatiques selon les besoins. Cela recouvre notamment l’informatique distribuée en temps réel, l’informatique adaptative, qui peut adapter ou configurer automatiquement des ressources informatiques pour différentes tâches, et l’informatique multi-agents. Celle-ci utilise des agents logiciels indépendants dits intelligents, intentionnels, mobiles ou encore agissant à distance. Ces agents supportent des applications, depuis le routage dynamique du trafic réseau aux réponses emails automatisées et à la gestion des processus des entreprises, en passant par les applications militaires et la résolution de problèmes multidisciplinaires dans la recherche scientifique. L’informatique dynamique s’impose comme une tendance majeure des technologies de l’information au XXIe siècle444. »

Ces applications peuvent employer diverses techniques regroupées sous l’appellation d’informatique évolutive445. Les systèmes dynamiques ont de multiples applications industrielles ; ils sont notamment utilisés pour les essais de moteurs dans l’industrie aéronautique ou encore dans les systèmes d’exécution de la fabrication dans l’industrie automobile446. Plus largement, dans les entreprises, les différentes catégories d’acteurs ont besoin d’informations spécifiques, tirées d’informations hétérogènes, et adaptées à leurs besoins :

« Les analystes souhaitent faire des requêtes sur la situation et l’histoire de l’entreprise qui les aideront à prendre des décisions. Les commerciaux veulent comprendre la relation qui existe entre l’entreprise et un client donné, englobant toutes les interactions passées et la situation présente. Les planificateurs financiers veulent intégrer les budgets globaux sur la base des projections budgétaires des unités qu’ils chapeautent et comparer les prévisions antérieures aux opérations actuelles de l’entreprise447. »

Des systèmes dynamiques répondant à des besoins aussi divers sont interactifs et pourraient être expérientiels. Les informations qu’ils présentent à l’utilisateur ou à d’autres systèmes sont hautement variables et dépendent d’instructions multiples et diverses des utilisateurs aussi bien que d’autres systèmes.

Un environnement dynamique particulièrement intéressant est celui des systèmes qui servent d’intermédiaires aux interactions entre organisations. L’adaptabilité de tels systèmes est considérée comme essentielle pour permettre aux organisations de nouer des alliances virtuelles, avec des processus métier faiblement intégrés. Il y a « alliance virtuelle » lorsque des systèmes en interaction pilotent des actions ou exécutent des transactions comme si les organisations avaient convenu au préalable d’une telle collaboration. L’intérêt des systèmes dynamiques tient notamment à ce que, pour permettre de telles actions, ils n’ont pas besoin que les organisations intègrent leurs processus métier ou conçoivent leur système pour interagir avec l’autre :

« L’utilité des systèmes complexes est renforcée si le système peut apprendre de l’expérience et adapter son comportement. À cet égard, la capacité du système de se développer et d’agir selon des modèles internes qui simplifient le monde extérieur est essentielle. Elle permet au système d’inférer les résultats des actions avant qu’elles ne soient engagées, et de choisir les actions qui ont des résultats utiles… La prochaine génération de systèmes devra permettre à des composants d’objets métier autonomes de décider avec qui collaborer, quels services proposer, quels services demander, et quels comportements adopter448. »

Les sous-systèmes de ces systèmes, appelés « composants d’objets métier », agissent comme des agents dans la conduite de l’activité de l’entreprise. Ils peuvent être programmés pour prendre des décisions et agir ; si ces actions restent de la responsabilité d’un employé ou d’un responsable de l’entreprise, ce n’est pas lui qui les accomplit personnellement. De tels systèmes peuvent légitimement être qualifiés d’interactifs bien que l’interaction ne s’exerce parfois qu’entre systèmes, ou à l’intérieur d’un système, sans implication humaine directe, en temps réel.

Il apparaît ainsi que « interactif », « expérientiel » et « dynamique » sont davantage des attributs des systèmes que des types de systèmes. Un système peut être seulement interactif mais un système expérientiel ou dynamique est aussi interactif, et un système peut être à la fois expérientiel et dynamique449.

Les documents interactifs, expérientiels et dynamiques

Le fait qu’un système soit interactif, expérientiel et dynamique n’implique pas que les documents produits ou reçus dans ce système le soient également. Dès lors, il faut étudier les objets d’information qui existent dans les systèmes interactifs, expérientiels ou dynamiques pour déterminer s’ils sont des documents. S’écartant de la définition diplomatique traditionnelle selon laquelle un document est une information fixée sur un support, InterPARES envisage le document comme information enregistrée – une distinction qui est loin d’être triviale. Dans le cas d’une sortie papier, le document, du fait qu’il est fixé sur un support, possède une forme fixe et un contenu non modifiable. Mais, dans l’environnement numérique, il est possible de générer quelque chose qui a toutes les apparences d’un document mais n’est pas fixé sur un support. Des systèmes interactifs, expérientiels et dynamiques peuvent ainsi afficher sur écran ou, plus largement, présenter une information qui a toutes les apparences d’un document sans que le système contienne nécessairement un objet correspondant exactement à ce document supposé450. Nous proposons de nommer ces objets qui semblent être des documents mais ne sont pas stockés, des pseudo-documents.

Les interactions, les expériences ou les processus dynamiques en temps réel ne produisent ou n’impliquent pas nécessairement des documents, même en apparence. Par exemple, un système dynamique qui contrôle la circulation sur un réseau peut se contenter de déclencher des changements dans l’acheminement des messages pour équilibrer la charge sur le réseau, sans produire quelque document que ce soit au sujet de ces actions.

A priori, il n’y a pas de restriction sur la forme ou le contenu d’un document mais il doit être une entité finie : il doit être possible de déterminer quelle information il contient ou ne contient pas, afin de qualifier sa forme, et de montrer en quoi le contenu dans cette forme constitue un tout indivisible. Avec une sortie papier, le contenu, la forme et l’unité du document sont intégrés et manifestes dans l’inscription physique sur un support. Dans l’environnement numérique, l’inscription physique de bits sur un support numérique ne peut pas indiquer de façon fiable quels documents sont écrits sur ces supports.

Un des apports majeurs d’InterPARES 1 a été d’établir qu’il existe une différence entre la forme dans laquelle un document numérique est représenté à une personne et la forme dans laquelle il est stocké numériquement, et de qualifier cette différence. Celle-ci est fondamentale à deux égards. Premièrement, elle distingue un document numérique d’un document traditionnel, qui est exactement ce qui est inscrit sur le support physique, comme c’est inscrit. Deuxièmement, elle oblige à décrire la nature exacte d’un document et à déterminer s’il continue d’exister lorsque la façon dont il est inscrit sur un support numérique change. Sans cette distinction fondamentale, nous ne serions pas en mesure d’affirmer, par exemple, qu’un document conserve son identité lorsqu’il est transféré d’un disque magnétique sur un disque optique, ou lorsqu’il est converti d’un format de traitement de texte à du HTML pour être publié sur un site web.

Le contenu, la forme et l’unité des documents électroniques sont établis selon des critères conceptuels et logiques, plutôt que matériels. La conception qu’a une personne d’un document numérique dépend de la façon dont il se manifeste à elle. Il peut être représenté sur un écran ou tout autre périphérique de sortie. Cette présentation est fondamentalement différente de la façon dont le document est encodé et inscrit sur un support numérique pérenne. L’encodage numérique, généralement décrit par des techniciens dans un modèle logique, permet à un ordinateur de produire ou de reproduire la présentation voulue mais elle n’a pas la même forme et, dans quasiment tous les cas, elle n’aura pas non plus le même contenu que dans le document représenté. Prenons l’exemple d’un document représenté dans un récit textuel. Il peut être encodé en mode caractère, comme dans un format de traitement de texte, ou comme une image du document, mais ni les valeurs des octets numériques qui correspondent aux caractères imprimables ni les octets qui sont projetés comme pixels dans une image n’ont la même forme externe que le document représenté. Le phénomène est identique avec d’autres caractéristiques de présentation, ainsi de l’organisation des paragraphes et de la mise en page. Le contenu du document encodé sous forme numérique sera également différent de celui du document représenté parce qu’il inclut des données indiquant comment présenter le document. On pense par exemple aux données fournissant les caractéristiques de présentation, telles que l’interlignage, les sauts de pages ou encore les italiques. Des exemples plus complexes en sont les spécifications pour extraire les données de différentes tables dans une grande base de données, les combiner avec des données invariantes et les présenter sous la forme d’une seule page. De nombreux éléments du contenu des composants numériques d’un document ne sont pas représentés à l’être humain. Si le document représenté est approprié pour communiquer l’information voulue par son auteur, il se peut que les éléments numériques invisibles ou imperceptibles soient nécessaires pour le présenter mais on ne peut dire d’eux qu’ils font partie du document représenté.

Un document encodé sous forme numérique comporte trois types de données : les données de contenu*451, qui constituent le contenu d’un document ; les données de forme*, qui permettent au système de reproduire le document dans la forme correcte ; et les données de composition*, qui disent au système quelles données de contenu et de forme appartiennent à quel document. Ensemble, les données de forme et de composition déterminent la structure d’un document numérique, ce qui ne signifie pas qu’elles sont équivalentes à la structure. Le terme « structure » est couramment utilisé en référence à l’organisation manifeste d’un document. Les données de forme imposent cette organisation au contenu d’un document alors que les données de composition disent au système quels objets stockés doivent être rassemblés pour constituer le document, et les associent aux différents éléments de structure définis par les données de forme452. Les trois types de données – contenu, forme et composition – peuvent être contenus dans un composant numérique* unique ou séparés dans plusieurs composants. Par exemple, un logiciel reconnaissant qu’un objet stocké est dans un format de traitement de texte considérera par défaut que l’objet représente un seul document, et contient toutes ses données de forme et de contenu. Mais si le même document était encodé en TIFF (Tagged Image File Format), chaque page du document pourrait être stockée dans un fichier distinct. Dans ce cas, le système utilisera les métadonnées de chaque fichier pour déterminer quels fichiers font partie d’un seul et même document, et dans quel ordre. Même dans le cas d’un document de traitement de texte stocké dans un seul fichier, certaines des données nécessaires pour afficher le document avec ses bonnes caractéristiques de présentation ne seront pas stockées dans ce fichier. En particulier, les données requises pour interpréter les chiffres binaires représentant chaque lettre ou nombre, afin d’afficher le texte à l’écran dans la bonne police de caractères, sont stockées dans des bibliothèques dynamiques extérieures au fichier. Dans d’autres cas, les données de forme, de contenu et de composition sont stockées séparément. Dans une application de base de données, par exemple, pour l’équivalent numérique d’un rapport imprimé, les spécifications concernant la forme documentaire sont stockées dans un fichier rapport, qui ne comprend aucune donnée de contenu ; les données de contenu, quant à elles, sont stockées dans des tables de la base de données. Toutefois, le rapport lui-même n’utilisera généralement qu’un sous-ensemble des données de contenu et les organisera autrement que la base de données elle-même. Les données de composition qui associent les éléments de données à inclure dans le rapport au modèle logique de données de la base de données sont stockées en tant que « vues » de la base de données. Pour produire une instance particulière du rapport, des données additionnelles de composition sont requises, et sont souvent fournies par l’utilisateur qui fait la requête. Par exemple, le fichier rapport d’un rapport mensuel de dépenses spécifie le contenu et la forme pour tous les mois, alors qu’un utilisateur doit spécifier un mois en particulier.

Les environnements interactifs, expérientiels et dynamiques peuvent produire les équivalents numériques des documents traditionnels. Lorsqu’un catalogue interactif en ligne est utilisé pour traiter des ventes, il doit produire les types de documents nécessaires à tout système de ventes : bons de commande, bordereaux de livraison, factures, reçus, etc. Qu’il soit enrichi ou non de propriétés expérientielles ou dynamiques n’y change rien. De même, les systèmes dynamiques utilisés pour collecter des observations scientifiques doivent satisfaire aux conditions requises des disciplines scientifiques concernées en matière de documents d’observation fiables. Et les systèmes d’administration électronique utilisés pour obtenir des permis ou des licences ou payer des redevances ou des amendes doivent produire et conserver les documents requis pour de telles transactions, indépendamment des caractéristiques du système. Par exemple, le livre foncier d’Alsace-Moselle, une étude de cas d’InterPARES 2 dans le domaine de l’administration, est un système interactif utilisé pour produire et recevoir des documents numériques dans des formes documentaires traditionnelles. Le livre produit des documents numériques qui correspondent exactement à l’ordonnance d’inscription453, à l’inscription dans le registre et aux documents d’archives associés, tels que contrats et cadastres, produits depuis des siècles lors de transactions foncières454.

La situation est plus complexe lorsque les objets produits par ou contenus dans des systèmes interactifs, expérientiels ou dynamiques sont très différents des documents traditionnels ou qu’ils n’ont pas d’équivalent traditionnel. Dans la suite de cet article, les documents interactifs, expérientiels et dynamiques sont décrits séparément ; toutefois, on verra que dans le cas des documents, comme dans le cas des systèmes, ces attributs ne sont pas exclusifs les uns des autres.

Les documents interactifs

Un objet interactif peut être décrit comme un objet qui, lorsqu’il est représenté à un être humain ou un autre système, permet à la personne ou au système d’entrer des données qui engendrent des changements dans les présentations ultérieures de ce même objet. D’une certaine manière, on peut dire que tous les documents numériques sont interactifs en ce sens que l’interaction de l’utilisateur est requise pour sélectionner le document à présenter, mais ce serait là une approche triviale de l’interactivité. Ne sont donc pas prises en compte dans notre analyse les interactions qui relèvent des possibilités génériques offertes par l’ordinateur et ne sont pas spécifiques à un document particulier. Par interactions génériques, on entendra notamment la sélection de documents pour extraction et sortie, la variation de la taille de la fenêtre dans laquelle le document est visualisé, le grossissement, la visualisation sur une ou plusieurs pages dans une fenêtre, ou encore les caractéristiques dites d’accessibilité, comme la modification de la taille du texte ou la restitution orale plutôt que visuelle du texte. Pour pouvoir être qualifié d’interactif, un document doit inclure des propriétés spécifiques permettant une intervention de l’utilisateur et utilisant cette entrée pour modifier le contenu ou la forme du document représenté. Les options de navigation à l’intérieur d’un document constituent une bonne illustration de la différence entre l’interactivité générique et l’interactivité du document lui-même. Les outils de navigation tels que les touches fléchées, les touches de défilement ou les boîtes de dialogue « aller à » sont des options génériques alors qu’un hyperlien qui permet à l’utilisateur d’atteindre un autre endroit du document ou d’afficher du contenu qui n’est pas stocké comme partie du document, est une option spécifique au document. Un objet interactif simple, mais non rudimentaire, consiste en un ou plusieurs jeux de données fixes et d’instructions associées (logiciel) pour sélectionner et présenter ces données. L’entrée de données par un utilisateur peut ainsi par exemple déclencher des instructions spécifiques qui sélectionnent certaines données stockées et les présentent à l’utilisateur. L’action de l’utilisateur pourrait aussi déclencher d’autres instructions déterminant sous quelle forme et dans quel ordre les données stockées sont présentées. Ainsi en va-t-il des pages web qui fournissent des services administratifs en ligne, des performances musicales basées sur des interactions homme-machine et des jeux vidéos.

Si les documents interactifs peuvent sembler identiques à des formes traditionnelles de documents, il convient de souligner que leur apparence ne reflète pas leur substance parce qu’elle est limitée à ce que le système présente à un moment donné. Supposons, par exemple, que ce que le système affiche ressemble à un document qui pourrait être imprimé sur papier, comme c’est le cas dans les systèmes de vente en ligne, où les données de contenu stockées comprennent les données qui constituent le catalogue des marchandises en vente, d’autres, l’état des stocks, des données additionnelles sur les options de livraison et de paiement, ainsi que des données sur chaque client, ses commandes et ses paiements. Un client parcourra le catalogue, en commençant par sélectionner une catégorie de produits dans une liste textuelle. Le système affichera alors des images et des informations de base sur les produits de la catégorie, permettant éventuellement à l’utilisateur de demander une autre image, une image plus grande, des informations textuelles complémentaires sur un produit donné, ou les avis d’autres clients ayant acheté ce produit. Les entrées de l’utilisateur sont des données de composition. Le système change ce qu’il affiche en réponse à chaque intervention de l’utilisateur. Les données de forme sont stockées dans un ou plusieurs fichiers HTML qui précisent comment un navigateur web doit afficher les données de contenu sélectionnées.

La première difficulté que soulève l’identification de ce type d’objets numériques comme documents précisément définis est que le système ne stocke aucun objet équivalent à ce que voit l’utilisateur. Il stocke une ou plusieurs bases de données à partir desquelles du contenu est sélectionné, et un ou plusieurs jeux d’instructions qui interprètent les entrées de l’utilisateur pour sélectionner, extraire et présenter une partie du contenu. Cette difficulté, toutefois, peut être résolue en reprenant la distinction établie par le premier projet InterPARES entre le format de stockage et le format de présentation des documents d’archives numériques. Dans les documents interactifs, toute présentation donnée est une manifestation éphémère d’une palette de possibilités contenues dans les composants numériques stockés. Le rapport du groupe de travail Conservation de la première phase du projet InterPARES indique : « (re)produire un document d’archives numérique implique de (1) le reconstituer, c’est-à-dire rassembler ses composants numériques s’il en a plusieurs, ou extraire tout composant numérique stocké dans un fichier physique contenant plusieurs composants de ce type ; et (2) le présenter dans la forme correcte455. » Il distinguait en outre les composants numériques des méthodes technologiques utilisées pour reproduire les documents456. Cette distinction suggère que les composants numériques consistent seulement en données de contenu ; toutefois, l’analyse des objets interactifs nous a conduit à préciser que sont du domaine des composants numériques les instructions qui sélectionnent et présentent le contenu dans une forme donnée (données de forme), aussi bien que les données de composition qui précisent encore le contenu sélectionné.

La seconde difficulté quant à l’identification des objets interactifs comme documents est que la rétroaction de l’utilisateur peut modifier tant le contenu que la forme sous laquelle l’information est affichée. Sauf à ce qu’il conserve un historique du feedback de l’utilisateur, le système est dans l’impossibilité de reproduire ce que l’utilisateur a vu457. Chaque représentation peut être différente. Pour autant, le système a la capacité de reproduire le catalogue dans son entier ou toute sélection de son contenu, et produirait la même représentation en réponse aux mêmes instructions de l’utilisateur. Dès lors, on peut dire d’un système qu’il conserve un document interactif, indépendamment de toute variabilité de forme et/ou de contenu, lorsqu’il garde la capacité de présenter ce document sur demande en réponse à des instructions identiques. Le fait qu’aucun utilisateur ne pourra jamais voir l’intégralité du catalogue en ligne n’est pas plus problématique que le fait qu’on ne consulte un dictionnaire que pour chercher la définition d’un ou de quelques mots.

Les documents expérientiels

Une expérience est la participation ou la réaction directe, subjective d’un individu à un événement, une activité ou une entité. Un objet expérientiel est un objet qui suscite une expérience ou qui saisit, d’une manière ou d’une autre, une expérience. À titre d’exemples d’objets expérientiels numériques, on peut citer les œuvres d’art électronique, le son et les images animées intégrés à une page web, les applications de suivi des activités des entreprises qui permettent à l’utilisateur d’exploiter une grande variété de sources de données, et les systèmes de réalité virtuelle.

Les systèmes expérientiels peuvent produire ou contenir des objets numériques qui sont les équivalents numériques de types traditionnels de documents ; par exemple, le texte d’une pièce de théâtre ou le script d’un enregistrement audio d’une représentation musicale peuvent être analogiques ou numériques. Bien que l’ordinateur crée effectivement des possibilités auxquelles n’a pas accès un artiste qui travaille avec des supports traditionnels, la même chose est vraie de différents supports traditionnels, comme la peinture à l’huile et l’aquarelle. Beaucoup d’œuvres d’art informatique visuel ne diffèrent fondamentalement des peintures et des dessins traditionnels que par le fait qu’elles sont numériques.

Il peut sembler plus délicat d’identifier des objets numériques incluant des types de données hétérogènes, par exemple du son et des images animées intégrés à une page web, comme des entités unifiées, mais ils sont en fait comparables aux enregistrements analogiques de son et de vidéo qui sont souvent liés à des documents textuels. Comme dans le cas des arts plastiques, il peut y avoir des différences importantes de la forme documentaire, les ordinateurs autorisant une plus grande diversité de formes. Par exemple, traditionnellement, le script et la pellicule d’un film ou les photos et affiches utilisées pour la publicité sont des formes documentaires différentes, mais dans l’environnement numérique, elles peuvent être réunies sur une page web, qui peut être traitée comme un seul et même document. En elles-mêmes, l’hétérogénéité des types de données et la multiplicité des objets qui peuvent être combinés en un seul document numérique ne posent pas plus de difficulté d’identification et de conservation qu’un document textuel sur papier comprenant d’autres types de données, comme des photos ou des diagrammes, ou composé de plusieurs objets qui pourraient être des documents indépendants ; par exemple, un rapport avec plusieurs pièces jointes.

Abstraction faite de la participation directe de l’individu, on peut distinguer deux types de documents numériques expérientiels : ceux utilisés pour créer une expérience et ceux qui la saisissent ou, pour être plus précis, ceux qui enregistrent la présentation qui a suscité l’expérience subjective ou un aspect de celle-ci, comme la réaction des participants par exemple. Une partition musicale incarne le premier type de document expérientiel, type permettant un nombre potentiellement illimité de représentations en ce qu’il donne les instructions pour jouer une œuvre, alors qu’un enregistrement audio d’une représentation, qui saisit une exécution particulière de ces instructions, incarne l’autre type458.

La distinction entre les objets qui rendent possible la représentation/performance et ceux qui en rendent compte peut sembler non pertinente pour les arts visuels. Dans les arts plastiques traditionnels, comme la peinture et le dessin, les artistes produisent des œuvres sur des supports qui peuvent être perçus aussi longtemps que l’instanciation matérielle continue d’exister. Dans l’environnement numérique, en revanche, les œuvres d’art visuel ne peuvent pas être conservées dans la forme dans laquelle elles sont accessibles aux êtres humains mais seulement dans une représentation binaire, indépendante de tout support. Pour faire l’expérience de l’œuvre numérique, les spectateurs dépendent d’un système capable de la reproduire à partir de ses composants numériques. Les documents numériques qui permettent la reproduction d’œuvres d’art visuel statiques peuvent être comparés aux enregistrements de représentations dans les arts du spectacle, les uns et les autres figeant un produit final dans la création d’une œuvre d’art et permettant que cette interprétation particulière soit extraite par la suite. Toutefois, les documents numériques qui rendent possible la présentation d’art visuel interactif appartiennent à la catégorie des objets qui rendent possible la performance459.

Le pionnier de l’art numérique Myron Krueger, par exemple, a créé des installations informatisées qui répondent aux instructions des spectateurs émises à partir de toutes sortes d’appareils, projettent une vidéo des spectateurs et permettent aux membres du public de modifier la projection vidéo en « touchant » virtuellement les images projetées d’eux-mêmes, d’autres membres du public ou d’objets générés par l’ordinateur : images graphiques dessinées par l’artiste en temps réel, guirlandes et ovales générés par ordinateur ou encore organismes animés460. Le contenu de ces œuvres d’art consiste en données produites au cours de l’expérience de l’œuvre : des objets visuels créés par des algorithmes à partir d’instructions émanant de divers capteurs, qui détectent la présence et les mouvements des spectateurs, et d’autres objets visuels ou dessinés par l’artiste qui observe les mouvements des spectateurs en temps réel ou générés par des algorithmes en mémoire, mais modifiés à partir de données produites par les spectateurs. À un niveau élémentaire, ces œuvres n’ont pas de contenu fixe mais, lorsqu’on les envisage de manière plus abstraite, en dépassant le simple niveau de l’œuvre telle qu’elle est vécue, il apparaît que le contenu est en fait borné par les limites que pose l’artiste aux possibilités des capteurs et des projecteurs (périphériques d’entrée et de sortie), qui forment chaque installation, ou aux programmes informatiques qu’il a écrits pour l’œuvre. Les programmes informatiques, de même que les documents décrivant les installations, appartiennent à la catégorie des documents qui rendent possible la performance. Alors que dans les applications marketing, les actions des utilisateurs influencent indirectement la sélection et la forme de présentation des données de contenu, dans les installations d’art interactif, les actions des utilisateurs non seulement façonnent directement la performance mais fournissent également une partie du contenu.

Ces exemples et études de cas dans le domaine des arts visuels conduisent InterPARES à suggérer que, dans le monde numérique, la différence entre les arts de la scène et les autres formes d’art disparaît, en ce sens que des artistes de tous domaines peuvent produire des œuvres numériques qui ne pourront être présentées dans le temps qu’en les recréant à partir d’un jeu d’instructions et des informations associées nécessaires pour exécuter les instructions telles que voulues par l’artiste.

Les études de cas d’InterPARES portant sur la musique électronique montrent que le jeu d’instructions enregistré par le compositeur – qui comprendra par exemple une partition, des codes informatiques et d’autres instructions concernant la performance – ne suffit pas toujours pour reproduire le morceau : l’œuvre peut également nécessiter des correctifs logiciels (patches), du matériel ou d’autres dispositifs spécifiques, tels qu’un synthétiseur, voire un type particulier d’interaction entre le(s) artiste(s)-interprète(s) et les éléments ci-dessus. À ce jour, ce type d’interaction n’a jamais été décrit d’une manière qui puisse être reproduite. À la lumière des résultats des études de cas461, les compositeurs et les chercheurs d’InterPARES sont de plus en plus convaincus qu’une œuvre de musique numérique ne peut être reproduite que si l’auteur en décrit chaque composant numérique, intellectuel et d’exécution ainsi que leurs interactions, en produisant un jeu d’instructions pour recréer chaque partie du morceau et le morceau comme un tout. Ainsi, les études de cas de musique numérique, mais aussi de théâtre numérique – comme nous le verrons plus loin avec l’étude de cas Waking Dream – laissent apparaître que la catégorie des documents expérientiels qui rendent possible la performance comporte au moins deux sous-catégories : l’une comprenant les instructions dont l’exécution produit une performance et l’autre décrivant les composants, contexte, conditions préalables ou requises pour la performance et dont l’exécution permettra de futures performances. En d’autres termes, l’artiste devra devenir un acteur de la conservation.

La distinction entre les documents expérientiels qui rendent possible la performance et ceux qui la saisissent est également valable pour les formes d’art non traditionnelles. Waking Dream, par exemple, est une œuvre théâtrale multimédia qui explore la frontière entre l’état d’éveil et celui de rêve. Deux danseurs incarnant « Éveil » et « Rêve » se déplacent sur la scène et parmi les spectateurs, accompagnés par une bande son, pendant que des vidéos live et enregistrées numériquement sont projetées tour à tour. Un des deux danseurs porte une caméra fixée sur son crâne et une télécommande qui autorise ou bloque la projection vidéo462.

Les objets numériques qui rendent possible la performance de Waking Dream sont les suivants : un document textuel qui décrit la représentation et donne des détails pour la monter, une collection d’échantillons sonores qui sont remixés avant chaque représentation pour en créer la bande son, des images enregistrées numériquement et un code informatique créé spécialement, grâce auquel l’ordinateur sert d’intermédiaire aux interactions entre la caméra, la télécommande, le projecteur vidéo et les appareils audio. Comme un catalogue de vente interactif, les objets numériques qui rendent possibles des performances de Waking Dream incluent des données de contenu – audio et vidéo en l’occurrence – et des instructions pour présenter l’œuvre, qui sont à la fois des données de forme et des données de composition. De la même manière, une présentation de l’œuvre implique un séquençage variable des données de contenu stockées, et la présentation des données dépend des interactions d’un des danseurs. Les quatre types d’objets pourraient être considérés comme des documents en eux-mêmes, puisqu’ils ont une forme et un contenu fixes. Le second type de document expérientiel numérique est également présent dans ce cas. Une représentation de Waking Dream a été enregistrée au format .mov Apple Quicktime : ce fichier reproduit cette représentation ou à tout le moins ceux des aspects de la représentation qu’il était possible d’enregistrer, l’essentiel du spectacle se déroulant quasiment dans l’obscurité, avec de la lumière infrarouge pour seul éclairage.

C’est un type d’objet expérientiel très différent qui est créé dans les applications d’e-marketing. À la différence des œuvres artistiques, qui sollicitent des expériences uniques, subjectives, les applications de web-marketing visent à produire une expérience qui débouchera sur un comportement spécifique : l’achat des produits ou services proposés par le commanditaire de l’application. À première vue, ces sites semblent comparables aux applications de commerce en ligne mais, à la différence de celles-ci, il n’est pas rare qu’ils n’offrent même pas la possibilité d’effectuer des transactions. Par exemple, les sites web des laboratoires pharmaceutiques ne proposent pas la vente de médicaments sur ordonnance mais ils ont fait la preuve de leur efficacité pour nourrir la fidélité à la marque et inciter leurs visiteurs à parler à leur médecin de tel ou tel médicament. Leur conception répond à des habitudes précisément identifiées des internautes, à savoir que la plupart des visiteurs d’un site médical d’une part, n’y retourneront pas et d’autre part, sont réticents à fournir en ligne des informations médicales personnelles. Sachant cela, on serait enclin à penser que ces sites n’ont que peu d’influence sur les comportements, or, c’est l’inverse qui est vrai. Plutôt que de donner au visiteur des informations qui soutiennent directement une transaction commerciale, les sites de marketing sont conçus comme des ressources d’informations personnalisées. Ils ne demandent pas aux visiteurs d’entrer des données personnelles mais observent à la loupe leurs comportements, tirant de leurs actions sur le site des informations en vue d’anticiper leurs demandes individuelles d’informations et d’y répondre avec le message marketing le plus approprié : « Qu’ils en aient conscience ou non, même les visiteurs les plus secrets donnent des informations à chaque site web sur lequel ils se rendent. Chacune de leur saisie est une indication de leur situation, leurs besoins et leurs préférences – si le site peut les interpréter et agir en conséquence463. » En quoi consistent les composants numériques de ce type de sites ? On y retrouve des documents HTML qui fournissent la forme documentaire de base du site, un stock de messages élémentaires qui peuvent être fournis en réponse aux entrées de l’utilisateur, des règles pour collecter des données sur la navigation des utilisateurs sur le site, des règles pour interpréter ces données afin qu’elles servent à sélectionner et présenter l’information stockée, et éventuellement des règles quant à la sauvegarde des entrées des utilisateurs en vue de créer des profils d’utilisateurs ou de catégories d’utilisateurs. Ces profils servent ensuite à déterminer plus finement quels messages présenter aux utilisateurs et dans quelle forme. À la différence d’un catalogue en ligne, dont le contenu sera généralement stable au moins pendant un laps de temps donné, les sites qui collectent en permanence des données sur le comportement des utilisateurs et les utilisent pour modifier les présentations ultérieures du contenu, créent des documents qui, en réalité, sont en devenir permanent. Ils ne sont jamais achevés, à moins que l’application soit arrêtée464.

Une visite sur un site marketing peut être considérée comme une expérience et les informations fournies par le site au cours de la visite peuvent être considérées comme analogues à une performance, encore que « production » soit sans doute un terme plus approprié. En conséquence, on peut dire que les messages stockés, les documents HTML et les règles rendent possible la production, et que les données capturées concernant la navigation de l’utilisateur sur le site peuvent être considérées comme les données de composition qui déterminent ensuite le contenu et la forme des informations présentées sur le site465. Les données de la navigation de l’utilisateur pourraient aussi être considérées comme l’enregistrement d’une expérience de ce site mais ces données ne sont pas utilisées pour reproduire l’expérience et peu susceptibles d’être organisées d’une manière qui rendrait possible la reproduction de l’expérience466.

En général, les documents qui rendent possibles des performances rendent également possibles des variations de la performance. Celle-ci change en fonction du degré de liberté que les instructions donnent au système qui les exécute ou aux personnes qui interprètent l’œuvre, de la capacité du ou des exécutants, des caractéristiques des instruments ou appareils utilisés, des caractéristiques des espaces où se déroule la performance, etc. Comme avec les documents purement interactifs, la documentation d’une œuvre d’art peut prévoir des changements de contenu ; dans Waking Dream, par exemple, le remixage des échantillons sonores, l’alternance de vidéos live et enregistrées, et les différences introduites par les mouvements des danseurs. S’il y a une part de liberté artistique chaque fois que des artistes exécutent en direct des instructions écrites, et si les limites de cette liberté sont sujettes à discussion, il y a aussi, inévitablement, des limites à la variabilité. La description des mouvements des danseurs dans Waking Dream, par exemple, est exposée en termes généraux mais l’œuvre doit être exécutée par exactement deux danseurs, dont l’un contrôle la projection vidéo. Si les échantillons sonores ou les images stockées étaient modifiés, il en résulterait une œuvre d’art différente, bien qu’étroitement apparentée à la première. La variabilité des représentations fondées sur des instructions documentées est commune aux œuvres d’art numériques et à celles enregistrées dans des formes plus traditionnelles.

Une performance capturée dans un ou plusieurs documents a une variabilité plus limitée que celle que permettent les documents qui rendent possible la performance467. Néanmoins, la reproduction d’une performance enregistrée variera en fonction de la qualité de l’enregistrement et du système utilisé pour la reproduire. Si certaines performances artistiques requièrent des dispositifs sophistiqués et complexes pour être exécutées, dans l’environnement numérique, il est possible de reproduire une performance en reproduisant simplement le document dans lequel elle est enregistrée. Par exemple, la présentation de musique ou d’autres sons enregistrés dans un format audio numérique, comme le MP3, est effectuée en « jouant » simplement le fichier sur un ordinateur doté d’une carte son, d’un logiciel et de haut-parleurs adaptés. De même, indépendamment de la complexité du logiciel utilisé pour les créer, il suffit pour reproduire des images numériques fixes d’art visuel – et, dans de nombreux cas, de vidéo – de présenter le document numérique dans lequel elles sont enregistrées.

La reproduction d’un document numérique ne suffit pas à reproduire une performance ; par exemple, lorsque des conditions particulières sont requises – une personne assistant à une performance doit être dans un espace spécialement conçu – ou lorsque la performance exige des dispositifs particuliers, comme des lunettes de réalité virtuelle. De toute évidence, tant le(s) format(s) des composants numériques du document que le système utilisé pour restituer une performance enregistrée doivent être appropriés. Ainsi, de la musique enregistrée au format numérique ne peut pas être reproduite sur un ordinateur dépourvu de carte son ou de haut-parleurs ; ou encore, la personne assistant à la performance doit disposer des moyens adéquats pour interagir avec le système utilisé pour la reproduire. Mais une fois ce seuil atteint, la question est celle des qualités de la reproduction, et non celle de savoir si l’œuvre est reproduite.

En résumé, dans les environnements expérientiels, nous avons trouvé deux types de documents qui peuvent être qualifiés d’expérientiels : (1) les documents qui rendent possible la performance ou la production d’une œuvre – tant les documents qui décrivent l’œuvre et/ou les instruments, appareils ou autres éléments utilisés dans sa performance, que ceux qui fournissent des instructions sur la manière de l’exécuter, et (2) les documents qui capturent une performance ou une expérience spécifiques. Établir la nature expérientielle d’un document vise avant tout à souligner qu’il n’est manifestement pas seulement – et peut-être pas du tout – destiné à communiquer des informations spécifiques mais à engendrer une expérience subjective468.

Les documents dynamiques

Les systèmes dynamiques eux aussi peuvent produire des équivalents numériques des documents traditionnels. Par exemple, ils interagissent avec d’autres systèmes pour conduire des transactions ou même nouer des contrats sans médiation humaine, mais les documents ainsi produits doivent être conformes aux conditions requises des documents d’archives produits dans le cadre de transactions et de contrats.

Toutefois, les systèmes dynamiques produisent également des objets qui pourraient eux-mêmes être décrits comme dynamiques. Un objet est dit dynamique lorsque (1) il a une forme fixe mais tire son contenu en temps réel d’autres sources, (2) les données de contenu disponibles pour la présentation sont fixes mais leur présentation, tant dans la forme que dans la sélection des éléments de contenu à présenter, varie en réponse à des instructions en temps réel d’un être humain, d’un autre système ou d’un périphérique d’entrée, ou (3) les données de contenu, bien que stockées au titre d’un ou plusieurs composants numériques, changent fréquemment par additions, suppressions ou remplacements. Ces types d’objets numériques dynamiques ne sont pas exclusifs les uns des autres. Un objet peut appartenir aux trois types ; mais il suffit d’appartenir à l’un d’eux pour entrer dans la catégorie des documents dynamiques. Qui plus est, les trois types sont aussi interactifs et peuvent être expérientiels.

Un objet qui acquiert de manière dynamique des données de contenu peut avoir une forme fixe en ce sens que ses caractères internes et externes se manifestent de telle sorte que l’apparence du document et sa structure intellectuelle ne changent pas. C’est par exemple le cas des sites web qui présentent des informations météorologiques ou le taux de change des devises. On peut dire de ces objets que ce sont des documents qui ont une forme fixe, certaines données fixes et certaines données variables. Sur un site météo, les données fixes sont par exemple les lieux pour lesquels les données météo sont disponibles ; sur un site de taux de change, ce seront les devises dont les taux de change sont indiqués. Quant aux données variables, ce sont la température, les précipitations, les taux de change, etc. du moment. Certains documents numériques de ce type peuvent aussi autoriser des variations dans la façon dont sont présentées les données de contenu, à l’instar de documents interactifs dont les données de contenu sont stables. Dans ces cas, la variation de la présentation est régie par des règles ou des instructions.

On trouve aussi ce type de documents dynamiques dans beaucoup d’autres systèmes, notamment les applications marketing ou les œuvres d’art visuel interactives décrites dans la section consacrée aux documents expérientiels. La source des données de contenu sera par exemple ici un instrument scientifique dans un laboratoire, un satellite qui transmet des images en temps réel, une caméra vidéo pointée sur une autoroute, ou des appareils sans fil qui transmettent le rythme cardiaque, la tension artérielle ou d’autres données biométriques d’un malade en consultation externe, ou toute autre source extérieure au système469. Ce type de document peut avoir une part de contenu fixe, uniquement du contenu variable ou une combinaison des deux. Les objets qui acquièrent, traitent et présentent, mais ne conservent pas les données provenant de sources externes s’apparentent à des formulaires imprimés temporaires ou intermédiaires. Par exemple, lorsqu’on commande un article dans un magasin de bricolage, le numéro et la description de l’article sont notés sur un formulaire papier temporaire, celui-ci est remis à l’employé qui entre alors les données portées sur le formulaire papier dans un formulaire de commande permanent sur le système informatique de l’entreprise et jette le formulaire papier. Un employé de l’entrepôt prend ensuite connaissance du formulaire de commande sur écran, va chercher la commande dans le stock, puis imprime une sortie papier de la version informatique du formulaire de commande. Dans ce type de transactions, l’impression est nécessaire parce que, alors que des données variables entrées sur un formulaire papier deviennent partie intégrante du document, avec les « formulaires » en ligne, les données ne sont incluses que dans l’affichage du document, et certains éléments en seront ignorés ou remplacés en réponse à des entrées ultérieures d’utilisateurs ou d’autres instructions externes. Parce que les données émanant de sources externes ne sont pas conservées dans le système, elles ne font partie du document que pendant qu’il est présenté par le système ou, naturellement, lorsque le formulaire est imprimé. Comme dans d’autres cas que nous avons évoqués, la forme et le contenu du document sont déterminés par les instructions qui régissent le traitement des données externes.

Les documents des applications de e-marketing appartiennent également au deuxième type d’objets dynamiques : les données de contenu disponibles pour présentation sont fixes mais la sélection des données de contenu et leur mode de présentation varient de façon dynamique. Relèvent de cette catégorie les applications web qui permettent à l’utilisateur de naviguer dans un site web à l’aide d’une palette d’options. Elles collectent en permanence des données sur les actions des utilisateurs – combien de secondes passe l’utilisateur sur telle ou telle partie du site, où il clique, etc. – mais ces données ne sont jamais affichées. Elles sont utilisées par l’application pour déterminer quels messages stockés afficher ensuite et comment les présenter. Ces documents ont un contenu global fixe, à savoir : les informations concernant le commanditaire du site et ses produits, les données de composition, qui changent en permanence, relatives aux interactions du visiteur avec le site, et une forme et un contenu documentaires spécifiques déterminés par les règles utilisées pour interpréter les données relatives aux interactions de l’utilisateur. Les applications de vente en ligne qui collectent des données sur les comportements des internautes et les utilisent pour définir la présentation de contenu appartiennent également à cette catégorie. On notera que ce processus est rigoureusement identique à celui décrit ci-dessus pour les documents expérientiels associés à des sites web marketing.

Le troisième type d’objet dynamique, où le contenu stocké change fréquemment, est en fait une variante du deuxième et peut être observé dans les applications dites d’e-administration, ou administration électronique. Une des études de cas d’InterPARES 2, VanMap, offre un exemple de ce type d’objet dynamique. VanMap est un système d’information géographique (SIG) qui permet à la ville de Vancouver de répondre aux besoins des fonctionnaires et employés municipaux en fournissant des services aux citoyens et aux entreprises de la ville. Les fonctionnalités de VanMap concernent les fonctions et activités des services municipaux suivants : services à la population, ingénierie, services aux entreprises, espaces verts et loisirs, police, pompiers et secours. Les décisions concernant l’organisation des strates d’informations du SIG et le choix des jeux de données contenus dans chaque strate sont prises de manière collégiale par les services concernés et l’équipe technique de VanMap. Les données sont téléchargées directement par chaque service dans Oracle Spatial ou extraites de bases de données de bureaux extérieurs (par exemple, les données de permis et de licences stockées en PRISM ou Licence+ sont exportées dans un serveur SQL ; les données concernant les impôts fonciers sont extraites du SQL Property Tax Systems, etc.) pour être intégrées à VanMap par l’équipe technique, qui est responsable de l’administration du système. Des graphiques d’ingénierie et de géométrie de construction de solides (CSG) sont créés sous la forme de dessins CAD dans AutoDesk, ou entrés ou copiés dans la base de données Oracle Spatial. Les données de VanMap sont écrasées à chaque mise à jour et, de temps à autre, les strates existantes sont modifiées afin de recevoir d’autres types de jeux de données, et de nouvelles strates sont ajoutées. Les données concernant les transactions auxquelles contribue le système sont remplacées ou effacées chaque fois que les données utilisées en appui d’un processus sont mises à jour, ou que de nouvelles strates de données sont ajoutées, ou chaque fois que les instructions d’un processus sont modifiées470.

Les systèmes dynamiques permettent souvent l’extraction et le traitement d’informations émanant de sources hétérogènes, où les sources elles-mêmes peuvent varier au cours d’une même exécution. Les systèmes dynamiques produisent également des résultats variables. La variation des types de données dans le flux entrant change à la fois les possibilités et les conditions requises pour traiter les entrées et, par conséquent, nécessite des systèmes capables de se reconfigurer eux-mêmes à la volée. Des changements dans la façon dont le système exécute ses processus peuvent se produire de manière autonome, le système évaluant en temps réel les sources externes qui fournissent des données, quelles données sont fournies ou les caractéristiques de ces données. Face à ces variations de données, le système convoquera différents agents ou composants logiciels ou, dans des cas plus sophistiqués, modifiera le logiciel qu’il utilise pour présenter les données. Les modifications au niveau du logiciel peuvent à leur tour modifier les données de contenu, par exemple en appliquant différents calculs à des données brutes. De telles techniques sont utilisées dans la planification et la modélisation des marchés financiers, ainsi que dans les domaines de l’art informatique et de l’edutainment471 » 472.

Conclusions sur les catégories de documents numériques

Les trois sous-sections précédentes montrent que les documents interactifs constituent une catégorie majeure de documents qui ne peuvent exister que dans un environnement numérique. Ils se distinguent des documents numériques qui n’autorisent pas d’interactions avec l’utilisateur modifiant la forme ou le contenu du document lorsque celui-ci est représenté. Ainsi pouvons-nous postuler une division élémentaire des documents numériques en documents statiques et documents interactifs. Les sous-sections précédentes montrent également que les documents dynamiques sont un sous-ensemble des documents interactifs, qui se caractérisent par le fait que leur variabilité dérive, au moins partiellement, de la variation des règles utilisées pour générer le document473. Dans ce dispositif, cependant, les documents expérientiels ne constituent ni une catégorie ni une sous-catégorie. Distingués sur la base de leur rôle dans la production d’expériences subjectives, les documents expérientiels peuvent être statiques, interactifs ou dynamiques. Par exemple, un artiste plasticien peut créer une image numérique statique, semblable à un tableau traditionnel. Mais l’artiste pourrait aussi y ajouter des caractéristiques interactives et utiliser des algorithmes dynamiques pour modifier la façon dont l’image est générée, ainsi que sa forme et son contenu.

Cette analyse nous permet de construire une taxinomie des documents numériques, présentée dans le Tableau 1.

Taxinomie des documents statiques, interactifs et dynamiques

Catégorie Description
1

Documents statiques

Les documents numériques sont statiques lorsque la possibilité de modifier leur contenu ou leur forme se limite à ouvrir et fermer le document, et à naviguer dans celui-ci. Une fois qu’un document statique a été récupéré et est représenté, l’intégralité de son contenu est disponible pour l’utilisateur et sa structure est immuable. Un utilisateur peut avoir besoin d’interagir avec le système pour accéder au contenu, ou à différentes parties de celui-ci, mais ces interactions ne modifient pas la forme ou le contenu du document.

Tout utilisateur exerçant une option pour naviguer à l’intérieur du document – y compris différentes options de présentations du document – se verra présenter le même résultat.

1.1

Les équivalents ou pendants électroniques des documents traditionnels

Exemples : lettres, rapports d’expériences scientifiques ou d’observations de phénomènes naturels produits par des systèmes dynamiques ; enregistrements sonores numériques, vidéo numérique, et œuvres d’art visuel.

1.2

Documents qui n’ont pas d’exact équivalent sous forme imprimée ou sous forme analogique mais possèdent une forme documentaire et un contenu fixes

Exemples : captures de pages web, enregistrements de performances d’œuvres artistiques qui ont des caractéristiques qui n’existeront peut-être que dans un environnement numérique, et résultats du gel et de la capture de la sortie d’un système qui modifie ses propres instructions pour traiter ou présenter des données de contenu.

2

Documents interactifs

Documents présentant un contenu variable, une forme variable ou les deux, et dont les règles déterminant le contexte et la forme de présentation peuvent être fixes ou variables.

2.1

Documents interactifs qui ne sont pas dynamiques

Documents dont les règles qui régissent le contenu et la forme de présentation ne varient pas, et dont le contenu présenté est sélectionné à partir d’un stock fixe de données au sein du système.

Exemples : catalogues de vente en ligne, pages web interactives et documents qui rendent possibles les performances d’œuvres musicales et d’autres œuvres artistiques.

2.2

Documents interactifs qui sont dynamiques

Documents dont les règles qui régissent le contenu et la forme de présentation peuvent varier.

2.2.1

Documents dont le contenu et/ou la présentation varient parce qu’ils comportent, ou sont affectés par, des données qui changent fréquemment.

Exemples : documents dans des systèmes dont la conception autorise la mise à jour, le remplacement ou la modification de données mais ne permet pas de garder des données plus anciennes ou écrasées, et sites web qui collectent des données des utilisateurs ou relatives aux interactions ou aux actions des utilisateurs sur un site web et utilisent ces données pour générer ou déterminer une présentation ultérieure.

2.2.2

Documents dont le contenu varie parce qu’il inclut des données reçues de sources externes et qui ne sont pas stockées dans le système.

Exemples : sites web qui présentent des informations sur des sujets comme la météo ou les taux de change, ainsi que de nombreuses œuvres artistiques interactives.

2.2.3 Documents produits dans des applications informatiques dynamiques, qui sélectionnent différents jeux de règles – applets474 ou composants de service – pour produire des documents en fonction de variations des entrées des utilisateurs, des sources des données de contenu et des caractéristiques de ce contenu.
2.2.4

Documents produits par des applications informatiques adaptatives ou évolutives, où le logiciel qui génère les documents peut changer de manière autonome.

Exemples : sites web dont le contenu renvoie à la planification et la modélisation des marchés financiers, ainsi que certains types d’art informatique dynamique et de sites d’edutainment.

* On trouve dans cette catégorie le produit de toute méthode utilisée pour capturer ou geler une information présentée par un système interactif, expérientiel ou dynamique.

Les documents d’archives interactifs, expérientiels et dynamiques

Un document interactif, expérientiel ou dynamique peut-il être un document d’archives ? Comme l’a établi InterPARES 1, deux caractéristiques essentielles du document d’archives numérique sont une forme fixe et un contenu non modifiable. Toutefois, ces contraintes ne sont pas absolues. Un document dont la forme ou le contenu auraient été altérés par accident, à la suite de mauvaises manipulations ou du fait de facteurs extérieurs, reste un document d’archives, sous réserve que la perte ou l’altération qu’il a subies ne portent pas atteinte à sa nature. Ces altérations doivent être envisagées au cas par cas.

Dire d’un document numérique au sens large qu’il possède une forme fixe ne signifie pas que cette forme soit totalement immuable, toujours identique à elle-même. Un document textuel sur papier a une forme immuable : la taille et la configuration des caractères alphanumériques sont fixées une fois pour toutes ; les marges sont strictement définies, etc. Mais, comme nous l’avons expliqué lorsque nous avons établi ce qui distingue les documents interactifs des documents statiques, tant la technologie utilisée pour présenter des documents numériques que les différents choix des utilisateurs qui les visualisent, peuvent causer des variations de la forme et/ou du contenu visualisé, même lorsque les données numériques stockées utilisées pour générer le document représenté demeurent inchangées.

En anglais, « record » (document d’archives/d’activité) vient du latin recordari, se souvenir. La fonction essentielle du record est d’établir une passerelle à travers les âges, de transporter les informations relatives à une action, un événement ou un état des choses, afin que l’on puisse s’y reporter et les utiliser dans le cadre d’actions futures ou pour savoir ce qui s’était produit, ce qui avait été dit ou décrit dans le passé. Abstraction faite de la variabilité due à des caractéristiques génériques de la technologique numérique, les documents numériques statiques satisfont clairement les conditions requises de forme fixe et de contenu non modifiable, indépendamment des caractéristiques des systèmes dans lesquels ils sont produits ou reçus. À titre d’exemple, on citera les bons de commande et les factures créés lors de transactions exécutées dans des applications de vente en ligne. Dans les cas de documents interactifs dont la forme ou le contenu varient selon des règles fixes (catégorie 2.1 dans le Tableau 1) et de documents dont la forme ou le contenu varient selon des règles qui peuvent elles-mêmes être variables (Tableau 1, catégorie 2.2), cette variabilité de la forme ou du contenu ne permet pas aux documents d'être utilisés comme des documents d’archives. En effet, un document qui ne contient pas un message fixe ou qui ne véhicule pas ce message dans une forme fixe ne peut pas être rappelé et ne peut être un moyen de se souvenir.

Toutefois, il est des cas où le contenu ou la forme varient sans pour autant affecter la fonction d’archives des documents. Dans de nombreux documents interactifs, expérientiels et dynamiques, des auteurs ou rédacteurs475 utilisent sciemment les possibilités offertes par la technologie numérique pour faire varier la forme dans laquelle sont présentées les informations. Dans ce type de cas, la forme est « fixe » en ce que la conception autorise la variation de certains aspects de forme et pas d’autres. Les formes documentaires incluant des éléments variables ne contreviennent pas aux conditions requises de forme fixe, pas plus que les enregistrements audio et filmiques analogiques dont le son et l’image varient au cours du temps. Cette variabilité de présentation voulue par l’auteur doit être considérée comme faisant partie des caractères externes de la forme documentaire. Dans les documents numériques dont la variation du contenu et/ou de la forme obéit à des règles fixes (catégorie 2.1 dans le Tableau 1), cette variabilité limitée n’est pas un produit des technologies de l’information en général mais est intégrée dans des composants numériques spécifiques au document lui-même, comme par exemple des formulaires interactifs, des applets qui génèrent des présentations différentes, des règles internes aux entreprises, un logiciel qui utilise la saisie de l’utilisateur pour déterminer une restitution ultérieure, et les règles qui permettent aux systèmes de s’adapter à des entrées et des demandes variables. Il est cependant difficile de concevoir comment un document dynamique, dont la forme et le contenu obéissent à des règles variables, peut être un document d’archives, sauf peut-être en tant qu’ « état préparatoire » en cours d’élaboration aussi longtemps qu’il reste dans le système dynamique.

Avec les documents d’archives numériques, dès lors, la forme fixe consiste en ceux des aspects de forme que l’auteur ou le rédacteur souhaitent ou peuvent contrôler. S’il est vrai qu’établir l’intentionnalité d’un individu n’est jamais chose aisée, pour autant, la variabilité générique qu’autorisent les technologies de l’information ne doit pas être considérée comme exprimant une intention de l’auteur ou du rédacteur. Par exemple, il est vraisemblable que l’auteur d’un document textuel souhaite, ou, à tout le moins, pense que son document s’affichera pour les lecteurs avec la même taille de police, la même longueur de ligne, les mêmes couleurs, etc. que celles que lui-même voit à l’écran. Mais il arrive que l’auteur n’ait aucune prise sur ce type de variations ; dès lors, les effets de différents matériels, taille de fenêtre sélectionnée par l’utilisateur, et d’autres aspects de variabilité dus à la technologie utilisée pour visualiser ou prendre connaissance d’un document après sa création ne sauraient être considérés comme relevant de l’intentionnalité de l’auteur. Les aspects de forme requérant une action délibérée spécifique de la part de l’auteur ou du rédacteur, comme la division du texte en sections, l’inclusion d’images dans un document textuel, et toute différenciation de l’apparence d’une partie du contenu, soit par rapport à un contenu adjacent soit par rapport à la norme pour le reste du document, véhiculent l’intention de l’auteur ou du rédacteur. De même peut-on parler d’un certain degré d’intentionnalité dans le choix par l’auteur ou le rédacteur d’un type ou d’un format de données numériques.

Un auteur ou rédacteur peut choisir de conférer une variabilité limitée au contenu d’un document numérique. Une catégorie importante de documents dont la variabilité de contenu ne contredit pas la nécessité de contenu fixe est celle des documents qui permettent l’affichage à tout moment de différents sous-ensembles de contenu. Les documents de la catégorie 2.1 du Tableau 1, dont relèvent les catalogues de vente interactifs, sont reproduits par des processus comportant des options qui permettent aux utilisateurs de sélectionner le contenu. Ces options peuvent être considérées comme analogues à la variation à laquelle serait exposé un utilisateur s’il consultait une page donnée d’un catalogue papier ou qu’il le consultait au hasard. Bien qu’on puisse contester le parallèle avec la lecture sélective d’un document imprimé dans la mesure où les possibilités pour sélectionner du contenu numérique ne sont pas entièrement, ni même principalement, à la discrétion de l’utilisateur, mais dépendent de règles qui font partie du document lui-même, ces règles ne sont pas fondamentalement différentes des restrictions imposées aux utilisateurs d’un catalogue imprimé par les aspects matériels du catalogue et les « règles » de mise en page (disposition, regroupement des produits par catégories, pagination, etc). En effet, si ce qui est présenté à l’utilisateur à tout moment peut sembler être un document, c’est bien plutôt une partie du seul document existant, le catalogue. Le contenu complet d’un catalogue de vente en ligne comprend toutes les données stockées et disponibles pour présentation à l’utilisateur : les données concernant les marchandises proposées à la vente, descriptions textuelles et images par exemple, ainsi que les données relatives à des sujets associés, options de paiement et de livraison notamment. La forme fixe du catalogue recouvre les aspects qui sont toujours montrés ainsi que ceux qui déterminent comment est présenté le contenu sélectionné, taille et position des images par exemple, et si le catalogue affiche différentes catégories de données dans des fenêtres distinctes de l’affichage principal. Les objets numériques qui rendent possible la sélection de contenu sont des composants numériques du document. Cette qualification n’invalide pas la nécessité de contenu fixe du document en tant que formant un tout. Elle prend simplement acte du fait que les environnements numériques interactifs permettent à un auteur ou un rédacteur de structurer un document de façon à permettre une sélection variable de contenu et un ordre variable de cette sélection. Les cas où la forme documentaire permet un affichage sélectif de sous-ensembles de contenus peuvent satisfaire aux conditions requises de contenu fixe.

Un document qui tire tout ou partie de ses données de contenu de sources externes et ne les stocke pas simultanément – par opposition à un ordre séquentiel – parmi ses composants numériques ne peut être présupposé contenir un message fixe. Cependant, dans certains cas, même les documents de cette catégorie peuvent être des documents d’archives. Comme une partition musicale ou le texte d’une pièce de théâtre, un document qui délimite une forme fixe dans laquelle des données externes seront présentées et pourront comporter du contenu inchangé, peut être un document d’archives instrumental ou d’instructions. Myron Krueger, par exemple, a créé des œuvres d’art où le logiciel génère des objets géométriques, qui sont projetés sur un écran où ils bougent et changent de taille et de forme ; cependant, la forme, la taille, le mouvement et la séquence des changements – le contenu spécifique – dépendent des caractéristiques ou des actions de spectateurs individuels. à la différence d’un catalogue de vente en ligne, dont tout le contenu est simultanément stocké dans un document numérique, dans ce type d’œuvres d’art, le document numérique qui génère la présentation ne contient pas toutes les données de contenu, du moins pas simultanément. Ce document détermine quels objets peuvent apparaître dans l’œuvre d’art, leurs caractéristiques élémentaires (par exemple, il définit si un objet est ou n’est pas une boucle géométrique fermée ; il donne à un autre l’apparence d’un petit animal ; et fait de la silhouette d’un spectateur capturée en temps réel un troisième objet) et les comportements qu’ils peuvent avoir (par exemple, il établit qu’une « Créature » cherchera à se déplacer jusqu’au point le plus haut de la silhouette d’une personne). Le contenu variable qui est manifesté dans une instance donnée peut être capturé dans un enregistrement de la présentation, mais il n’est pas stocké dans le document qui rend possible la présentation.

Les œuvres d’art de ce type et les catalogues de vente en ligne ont ceci de commun que, dans les deux contextes, le document qui est conservé à des fins de consultation future est l’objet numérique qui est stocké dans le système. Ce n’est pas la matérialisation de cet objet sur un écran d’ordinateur ou tout autre dispositif de restitution. Pour autant que les autres conditions requises du document d’archives soient remplies, dans ce type de cas le document d’archives est l’objet numérique, non la forme perceptible par l’homme qui est reproduite à partir de celui-ci.

Les applications peuvent afficher des pseudo-documents dont la présentation comprend à la fois des sous-ensembles sélectionnés de contenu stocké et des données obtenues à partir de sources externes. Si l’utilisateur d’un catalogue en ligne fait une requête concernant la disponibilité actuelle d’un article, l’application enverra une requête à la base de données qui suit les articles dans l’entrepôt de l’entreprise, ou elle pourrait même interroger la base de données des stocks d’un fournisseur indépendant. L’application utilisera alors la réponse de la base de données pour informer l’utilisateur de la disponibilité de l’article, et du délai d’expédition, affichant ces informations comme si elles faisaient partie du catalogue. C’est à dessein que ce type de données externes, actualisées en permanence, ne sont pas stockées dans le catalogue. Derrière le contenu variable, le document catalogue doit inclure des règles fixes qui permettent au système d’obtenir et de présenter les données variables en temps réel. Ces règles font partie du document numérique stocké.

La description de ce mode d’expression artistique qu’est la performance dans la sous-section ci-dessus consacrée aux « documents expérientiels » a conduit à distinguer les documents qui rendent compte de la performance des documents qui la rendent possible. Comme nous le voyons maintenant, cette distinction s’applique également à d’autres domaines. Les documents interactifs, à une exception près, sont des documents instrumentaux. Ils rendent possible la performance d’œuvres d’art, l’exécution de transactions, la conduite d’expériences ou la mise en œuvre de programmes pour collecter et analyser des données d’observations. L’exception est représentée par les documents pour lesquels la modification des données de contenu ne reflète pas une intention explicite de l’auteur, mais résulte d’une incapacité à permettre la rétention des données dans le système et/ou à compenser les changements du système. C’est ce que l’on peut observer dans le cas de VanMap, où les données sont régulièrement écrasées et où le modèle de données est parfois modifié. On est alors dans l’incapacité de reproduire les documents précédemment créés dans le système, soit qu’une partie de leur contenu n’est plus disponible soit que, même lorsque l’intégralité du contenu d’origine reste disponible, les changements dans le modèle de données conduisent à inclure dans des présentations ultérieures du document de nouvelles catégories de données qui n’étaient pas présentes dans la version originale, ou à sélectionner, traiter ou présenter le contenu original d’une manière différente.

Cette analyse a conduit à un concept de document d’archives numérique très différent de celui élaboré au cours de la première phase d’InterPARES. Dans InterPARES 1, un document d’archives numérique est tout document représenté par un système informatique à un être humain ou un autre système. La forme du document est celle du document représenté produit par le traitement ad-hoc des composants numériques stockés. Les composants stockés permettent la reproduction du document mais ne sont pas le document d’archives. Cette distinction entre le document d’archives représenté et ses composants numériques est fondamentale et essentielle, d’une part parce que des erreurs dans le traitement des données pourraient se traduire par l’impossibilité de reproduire le document ou par la production d’un document différent et d’autre part, parce qu’il est possible de conserver le document représenté – c’est-à-dire de conserver la capacité de le reproduire – même lorsque les composants numériques sont altérés, par exemple, par un reformatage ou une migration vers des supports numériques différents. Dans cette conception du document d’archives, toutes ses propriétés essentielles sont dans le document qui est représenté, et ces propriétés sont foncièrement indépendantes de la façon dont le document est encodé en composants numériques. Ainsi, il existe une dépendance inverse entre le document et ses composants numériques : le document est produit à partir de ses composants numériques, mais les composants doivent être produits de façon à garantir que toutes les propriétés essentielles du document soient présentes et identiques chaque fois que le document d’archives est représenté.

Ces conclusions n’étaient pas fausses mais trop limitées. Étant donné la fonction mémorielle essentielle du document d’archives, les composants numériques peuvent eux-mêmes constituer un document d’archives ou un groupe de documents d’archives, selon la façon dont ils sont instanciés dans le système. En d’autres termes, les composants numériques et le document reproduit à partir de ces composants peuvent constituer des documents d’archives distincts mais apparentés : le(s) document(s) stockés sous forme numérique, et le « document représenté » qui peut être défini comme la visualisation ou la matérialisation du document dans une forme adaptée à la présentation à un être humain ou un autre système. La finalité première de la conservation du document d’archives stocké est de pouvoir reproduire le document représenté, alors que le document représenté est conservé pour communiquer des informations à un être humain ou à d’autres systèmes. L’étude des documents interactifs dans InterPARES 2 conduit à enrichir le concept de document d’archives représenté pour englober toutes les variabilités de forme et de contenu spécifiques au document. Les études de cas conduites dans le cadre d’InterPARES 2 ont également permis d’établir qu’un document d’archives stocké sous forme numérique comprend non seulement les données qui doivent être traitées afin de reproduire le document présenté mais, aussi les règles de traitement des données, y compris celles qui permettent des variations du contenu ou de la forme du document présenté. Une autre raison de distinguer les documents stockés des documents représentés tient à ce que un ou plusieurs des composants numériques d’un document représenté peuvent également être utilisés pour en reproduire d’autres. Si un objet stocké est utilisé pour reproduire plus d’un document représenté, il ne peut être l’équivalent d’aucun d’entre eux. Qui plus est, si, dans un groupe de composants numériques qui sont utilisés ensemble pour reproduire un document représenté, l’un quelconque des composants est utilisé dans la production de plusieurs documents indépendamment des autres, alors, ce composant doit être considéré comme un document d’archives.

Pour radicales qu’elles puissent sembler, ces conclusions ne sont pas sans précédent. Dans l’Europe médiévale, lorsque la profession des notaires est devenue tellement puissante que la plupart des transactions devaient être enregistrées et conservées par eux, ils se sont attachés à rationaliser leurs méthodes de travail, notamment en faisant l’économie de la rédaction exhaustive des documents des transactions dont ils étaient témoins. Ils prenaient un parchemin, en repliaient un coin et y inscrivaient le type de la transaction, le nom des parties, la date, la description de l’affaire ou de la propriété objet de la transaction, et toute autre donnée particulière à la transaction en question. Ensuite, ils classaient le parchemin vierge au coin annoté, appelé brève476. à la fin de chaque année, ils reliaient toutes les brèves de l’année pour former un registre qu’ils indexaient volume et/ou conservaient un enregistrement séparé des transactions réunies dans le registre. Si, par la suite, une ou plusieurs parties à la transaction, ou leurs descendants, réclamaient le document complet de la transaction, le notaire faisait une recherche par date pour trouver le volume contenant la brève en question, récupérait le document par l’index ou le registre, prenait un nouveau parchemin (ou une feuille de papier) et rédigeait un document complet en suivant les formules contenues dans un recueil spécial, le formulaire, qui fournissait des instructions précises pour la rédaction des documents de chaque type de transaction intervenant dans un intervalle d’années donné, et inscrivait la date portée sur le coin de la brève là où il le fallait. Les notaires ne conservaient donc pas le document complet de chaque transaction dans sa forme définitive, mais un document du contenu de la transaction et un autre document de la forme documentaire dans laquelle ce type de transaction devait être manifesté. Au lieu de conserver des documents de transaction en tant que tels, ils préservaient la capacité de produire un acte authentique d’un tel document sur demande. Dans ce système, chaque brève, formulaire, registre et expédition est un document d’archives.

Les notaires conservaient un document rendant compte du fait qu’une transaction avait eu lieu (registre et/ou index), un deuxième document définissant la forme documentaire pour les différents types de transactions avec l’identification des attributs variables requis dans chaque type de document (recueil de modèles d’actes ou formulaire) et un troisième document contenant les valeurs de données de ces attributs pour chaque transaction (brève). Associant le modèle de document contenu dans le recueil de modèles d’actes aux valeurs spécifiques portées dans la brève, eux et leurs successeurs pouvaient ainsi produire le document exact et authentique de la transaction en cas de besoin, même des siècles plus tard. Chaque document de transaction produit de la sorte était un document original. Cependant, étant donné la confiance dont était investie cette pratique, les parties à la transaction ou leurs successeurs ne demandaient presque jamais que soit émis le document complet : l’existence de la brève dans les archives d’un notaire constituait une preuve suffisante de la transaction.

Figure 1. Conserver et produire des documents en utilisant des recueils de modèles d’actes et des brèves.

Cette pratique est représentée en Figure 1. Le recueil de modèles d’actes, ou formulaire, contient les données de contenu invariables, énonce les aspects essentiels de la forme documentaire et indique les éléments de données variables dont les valeurs doivent être spécifiées dans chaque expédition, alors que la brève contient les données d’instance pour une unique transaction. Ainsi, les brèves pour toutes les transactions de type « a » comprendront les éléments de données spécifiés dans le recueil de modèles pour les transactions de ce type. Dans le système de la brève, les documents de diverses transactions, comme les contrats et les titres, étaient conservés mais non dans les formes documentaires prescrites pour ces transactions. Le système d’archivage des documents permettait à ceux qui en avaient la garde de produire des expédition dans les formes requises, sur demande. Toute expédition d’un document transactionnel produite de cette manière était un original477. Il est intéressant de noter que le système de la brève était tellement fiable que, au fil du temps, les personnes qui avaient besoin de connaître le contenu du document d’une transaction se contentaient de vérifier les données portées dans la brève, sans demander que soient établis les documents dans les formes documentaires prescrites par le recueil de modèles d’actes correspondant. Même si la brève n’était pas le document complet prévu, mais seulement un prélude à celui-ci, elle tenait lieu de document fiable d’une transaction d’un type donné. La fiabilité était conditionnée au fait que le système pouvait produire un document authentique complet de la transaction, à la demande.

Fonctionnellement, les recueils de modèles d’actes et les brèves sont les équivalents des documents stockés sous forme numérique décrits plus haut478. Alors que le système des brèves séparait matériellement les données de contenu relatives à une transaction spécifique de la forme documentaire et du contenu invariant (c’est-à-dire les caractères externes et internes de forme), dans l’environnement numérique, la séparation matérielle n’est qu’une possibilité parmi beaucoup d’autres. Les technologies numériques de l’information offrent toutes sortes de moyens de garder et de combiner des données et des instructions. Ce qui est essentiel, c’est que l’ordinateur stocke et traite les données et les instructions en distinguant chaque type et en combinant les différents composants numériques d’un document de manière systématique et correcte479.

Des pratiques similaires existent dans l’environnement numérique. La Figure 2 décrit, de manière abstraite, un processus courant de conservation de documents d’archives utilisant des applications de bases de données. Les trois éléments dans la partie supérieure du graphique (formulaire de base de données, données d’instance et copie₁ du document) illustrent de manière sommaire comment des documents peuvent être générés en appliquant un formulaire de base de données aux données des instances individuelles des types de transactions prises en charge par le formulaire. Ce processus n’est pas sans évoquer l’usage médiéval des brèves. Les technologies numériques, toutefois, offrent un éventail plus large de possibilités pour mettre en œuvre cette pratique. La partie inférieure de la Figure 2 présente une vue plus détaillée du processus de saisie des données d’instances individuelles dans les formulaires. Dans une base de données, toutes les données n’ont pas besoin d’être conservées dans un seul « document » ou objet logique dans l’application. Un formulaire peut être rempli avec les données d’une seule instance stockée en plusieurs endroits de la base. C’est ce qu’illustre la Figure 2 pour une base de données relationnelle, où les données de chaque cas individuel sont disséminées dans plusieurs tables. La base de données conserve trace des données des instances individuelles grâce à un modèle de données logique qui définit comment les entrées de données d’une table sont liées à celles d’autres tables. L’application de base de données remplit un formulaire, garantissant que les bons éléments de données d’une instance sont entrés aux bons endroits, conformément aux règles qui associent le modèle logique de données au formulaire. Élément supplémentaire de complexité dans l’environnement numérique, les données individuelles peuvent être combinées de différentes manières avec d’autres données pour produire différents types de documents ; par exemple, les données d’une commande en ligne peuvent être utilisées pour remplir une liste, un bordereau d’expédition et une facture.

Dans cette conception du document d’archives numérique, quand un composant numérique du document d’archives représenté est-il lui-même un document d’archives ? C’est par exemple le cas lorsqu’un seul composant numérique, comme une image binaire d’un document imprimable, comprend toutes les données nécessaires pour reproduire le document représenté : il y a alors une correspondance biunivoque entre le composant numérique et le document représenté. Un autre exemple peut être observé lorsque, dans une base de données complexe comme celle représentée en Figure 2, un composant numérique, le « formulaire de base de données », possède une unité, une autonomie et une complétude fondamentales, exactement comme le recueil de modèles d’actes médiéval. En revanche, ce ne serait pas le cas pour le composant numérique « données d’instance » parce que chaque donnée nécessaire pour remplir le formulaire est reconnue et traitée par l’application de bases de données comme un train de bits distinct, et est par conséquent dépourvue de signification en elle-même. Elle n’acquerrait de signification que dans le contexte d’un modèle de données. Qui plus est, alors que l’application peut isoler chaque donnée, elle ne la stocke pas ou ne la gère pas en tant qu’objet distinct. Les données sont définies et stockées en tant que parties des tables de la base de données. De sorte que, s’ils sont gérés comme il convient, chaque table de la base, le modèle logique de la base de données et tout autre modèle – par exemple, celui qui définit un formulaire ou un rapport -, peut constituer un document d’archives stocké.

Figure 2. Produire des documents à partir de bases de données.

La Figure 3 présente un modèle générique synthétisant ce que nous avons pu établir des documents d’archives numériques à ce stade. Il peut être appliqué à des environnements informatiques traditionnels, interactifs, expérientiels et dynamiques qui produisent des documents et il peut être utilisé comme outil d’analyse pour déterminer les caractéristiques et la nature de documents d’archives numériques480. Les trois premiers éléments, en partant de la gauche, de la rangée du milieu de la Figure 3, décrivent de manière très abstraite la production d’un document représenté* à partir d’un document en mémoire*, processus commun à ces différents types d’environnements. Dans un système dépourvu de caractéristiques interactives ou expérientielles, la dernière figure de la ligne du milieu, Interaction/Expérience, n’interviendrait pas, d’où les lignes pointillées qui la relient aux autres éléments. Le document représenté peut l’être à une personne ou à un autre système. Il est supposé comporter tout le contenu qui pourrait être représenté, même si seule une partie de celui-ci est représentée à un moment, comme dans le cas d’enregistrements audio et vidéo et de pseudo-documents. Pour que le document représenté soit un document d’archives, il doit être possible de le reproduire à plusieurs reprises tel qu’il est apparu la première fois. Si l’environnement permet à un utilisateur ou à un système en interaction d’entrer des données (ligne du haut) et que ces instructions modifient le contenu ou la forme du document représenté, alors, ce document ne peut être un document d’archives même si d’autres conditions requises sont satisfaites. Indépendamment du fait qu’il s’agisse ou non de documents d’archives, il se peut qu’un ou plusieurs documents d’archives conservés en mémoire sous forme numérique soient utilisés pour produire le document représenté. Si le système stocke un objet qui est la représentation interne du document représenté, cet objet peut être un document d’archives stocké. Dans le cas d’un document représenté statique, le document en mémoire doit contenir toutes les données de forme et de contenu et toutes les règles qui déterminent les caractères externes de la forme du document représenté. En cas de correspondance biunivoque entre le document stocké et le document représenté, il n’y a pas de données de composition parce que le document stocké est déjà composé. Le document stocké comprendrait alors des règles pour modifier le contenu et/ou la forme du document représenté, ce qui n’empêcherait pas que le document stocké puisse toujours être un document d’archives, analogue au recueil de modèles médiéval, sous réserve qu’il présente toutes les autres caractéristiques nécessaires du document d’archives. Cependant, si le document stocké est lui-même modifiable par une instruction ou des données externes, il ne peut être un document d’archives. Si le système ne stocke pas une unique représentation du document représenté, il est nécessaire de déterminer comment il compose ce document à partir des données de forme, de contenu, de composition et des règles associées, et si les composants numériques qui constituent ces types de données sont stockés entièrement à l’intérieur du système ou dérivés en tout ou partie d’une ou plusieurs sources externes, pour identifier tout document d’archives en mémoire.

Figure 3. Modèle générique des documents en mémoire et représentés.

Tout ce que le producteur traite comme un document d’archives est un document d’archives mais ce doit être quelque chose que le producteur peut effectivement conserver, associer à d’autres documents et rappeler ultérieurement. La fonction mémorielle d’un document d’archives peut s’exercer selon deux modes. Dans la plupart des cas, la fonction mémorielle du document est rétroactive : c’est le moyen par lequel son producteur se souvient de ce qui a été fait, de ce qui s’est produit ou de ce qui a été décrit ou dit, et par lequel d’autres peuvent connaître le passé. Par exemple, le document d’archives de la représentation d’une œuvre artistique est rétrospectif : il permet au public de se souvenir – ou, plus exactement, dans la plupart des cas, de découvrir – comment l’œuvre a été exécutée lors de cette performance particulière. Mais il y a aussi des documents dont la principale fonction est prospective. Une partition musicale ou le texte d’une pièce de théâtre peuvent être considérés comme des documents d’archives révélateurs de la carrière ou du génie de l’artiste. Ils peuvent ainsi être étudiés pour ce qu’ils révèlent de l’évolution des capacités et des apprentissages de l’artiste, de l’influence des événements biographiques sur la production artistique, etc. Cependant, ce qui motive la création de la pièce de théâtre ou du morceau de musique, c’est en premier lieu qu’ils soient représentés/joués. Le texte et la partition ont une fonction prospective : ce sont des jeux d’instructions pour des actions qui seront accomplies ultérieurement.

La distinction entre documents rétrospectifs et documents prospectifs peut nous aider à mieux cerner les documents d’archives dans les environnements interactifs, expérientiels et dynamiques. Les interactions entre êtres humains et systèmes informatiques, les expériences rendues possibles ou portées par des systèmes expérientiels et les processus qui sont constitués et accomplis avec, au minimum, un certain degré de spontanéité par des systèmes dynamiques ne sont pas les résidus d’une action. Ce ne sont pas des moyens de nous souvenir de ce qui a été fait ou de ce qui doit être fait. En bref, ce ne sont pas des documents d’archives. Mais ils peuvent être capturés dans une forme documentaire et certains de ces documents pourraient être traités et utilisés comme des documents d’interactions, d’expériences ou de processus dynamiques, c’est-à-dire qu’ils peuvent devenir des documents d’archives de ces activités. En outre, les interactions, expériences et processus sont rendus possibles par des documents à l’intérieur des systèmes en question et ces documents peuvent servir de documents d’archives prospectifs. On trouve des documents rétrospectifs et des documents prospectifs dans les trois domaines explorés par InterPARES 2. Dans le domaine des arts, ce sont les enregistrements de performances et les documents qui rendent possibles les performances. Dans le domaine de l’administration, les documents créés lors de l’exécution de transactions administratives peuvent être des documents rétrospectifs. En science, la documentation de la conduite et des résultats d’expériences et d’observations est rétrospective. Dans la sphère de l’administration, les lois, réglementations et directives et, en science, les programmes et protocoles de recherche sont créés avec l’intention première de guider, contrôler, voire interdire des actions ultérieures481. En résumé, les documents d’archives rétrospectifs capturent des interactions, expériences ou processus dynamiques alors que les documents d’archives prospectifs les rendent possibles ou, à tout le moins, les informent.

La catégorie des documents prospectifs comporte deux sous-catégories. La première contient simplement les instructions relatives à l’exécution d’une action ou d’un processus. La seconde participe activement à l’exécution de l’action ou du processus. Les partitions musicales, les règlements, les manuels de procédures et les instructions pour remplir des formulaires sont des exemples de documents d’instructions. À titre d’exemples de documents d’archives instrumentaux, on peut citer les correctifs logiciels qui permettent à un instrument de musique d’interagir avec un ordinateur, le logiciel qui, dans les sites de marketing en ligne, interprète les données relatives aux actions d’un visiteur sur le site pour déterminer quels éléments de contenu doivent lui être présentés ensuite, et les agents logiciels qui permettent à des applications professionnelles en interaction d’exécuter des transactions de manière autonome. Bien qu’un logiciel ne soit généralement pas considéré comme un document d’archives – il convient plutôt de l’envisager comme un composant numérique de documents d’archives -, dans les contextes particuliers présentés ici, ce type de logiciels est un document d’archives en ce sens qu’il est généré et utilisé comme un moyen d’accomplir l’activité à laquelle il participe et apparaît comme l’instrument, le produit dérivé et le résidu de cette activité.

Outre qu’ils ne participent pas de la même manière aux actions ou processus qu’ils informent ou contrôlent, les documents d’instructions et les documents instrumentaux se distinguent par la manière dont ils sont matérialisés en vue d’accomplir la finalité pour laquelle ils ont été créés. Destinés à être lus par des êtres humains, les documents d’instructions sont représentés en étant reproduits à partir des composants numériques stockés dans une forme lisible par l’être humain. Les documents instrumentaux, eux, remplissent leur finalité dans la forme numérique dans laquelle ils sont stockés482 et, inversement, ne peuvent remplir cette finalité s’ils sont transformés en un format lisible par l’être humain. Qui plus est, tant qu’ils demeurent actifs, les documents instrumentaux doivent être maintenus dans les systèmes dans lesquels ils ont été créés – ou dans des systèmes ayant une fonctionnalité identique. Faute de quoi, ils ne produiront pas ou n’accompagneront pas les interactions, expériences, performances ou autres processus qu’ils étaient censés générer483.

Conserver des documents d’archives interactifs, expérientiels et dynamiques

Les documents d’archives stockés sous forme numérique sont conservés en vue de pouvoir reproduire les documents représentés. Il existe trois possibilités pour les conserver : (1) conserver les documents d’instructions dans le système où ils ont été générés, avec toutes les instanciations produites à partir d’eux, (2) conserver les documents d’instructions dans un autre système et (3) conserver les documents instrumentaux, et les documents qu’ils ont permis de produire, dans le système dans lequel ils sont utilisés484. Naturellement, la possibilité de conserver des documents n’implique pas que des documents soient effectivement conservés. Chaque cas doit être examiné pour déterminer si et comment les documents sont conservés.

La première façon de conserver des documents d’archives stockés sous forme numérique est de les garder dans les systèmes interactifs, expérientiels ou dynamiques dans lesquels ils ont été produits. Un système ayant la capacité de produire les documents représentés, il pourrait être conçu pour les reproduire ultérieurement à partir des documents en mémoire. Un exemple de document d’instructions conservé dans un système interactif est le script de Waking Dream, qui est conservé sur le site web de l’œuvre. Le livre foncier d’Alsace-Moselle offre un exemple de système utilisé à la fois pour exécuter des transactions et pour conserver les documents de ces transactions.

La possibilité de reproduire un document d’archives en utilisant la même fonctionnalité que celle qui l’a produit à l’origine n’existe pas lorsqu’une partie du contenu n’est pas stockée dans le système. Dans le cas de présentations d’un document, même si le système a la capacité de produire le même document en réponse à une même instruction à plusieurs reprises et de manière fiable, cela ne signifie pas nécessairement que le système conserve la présentation du document en tant que document d’archives. Cette difficulté est illustrée dans une des études de cas d’InterPARES 2, Atlas cybercartographique de l’Antarctique (CyberCartographic Atlas of Antartica). D.F.R. Taylor définit la cybercartographie comme « l’organisation, la présentation, l’analyse et la communication d’informations spatialement référencées concernant une grande variété de sujets et d’usages dans un format interactif, dynamique, multimédia, multimodal et multidisciplinaire. » L’Atlas cybercartographique de l’Antarctique intègre des données scientifiques et environnementales dans « un atlas en ligne qui décrit, explore et fait partager les complexités du continent Antarctique à des fins d’éducation, de recherche et d’élaboration de politiques publiques485. »

L’Atlas organise en modules de contenus thématiques des données hétérogènes sur des caractéristiques physiques, biologiques et façonnées par l’homme et leurs interactions, et supporte diverses fonctions d’exploration, de visualisation et d’accès. Les volumes de données sont importants et on anticipe qu’ils augmenteront avec le temps. Les valeurs des données dans l’Atlas sont dans des formats stables et élémentaires définis pour accepter différentes présentations adaptées aux différents utilisateurs : spécialistes, grand public et pouvoirs publics. Toutefois, ces formats sont en fait des points de départ permettant aux utilisateurs d’explorer et d’accéder à des contenus de manière interactive. L’utilisateur de l’Atlas a la possibilité de choisir parmi un éventail très large, mais néanmoins fini, d’outils pour rechercher, visualiser, écouter ou accéder de toute autre manière à des données hétérogènes sur des thèmes qui l’intéressent. Dès lors, les formes dans lesquelles les données sont présentées ne sont pas immuables mais, comme dans le cas de performances artistiques, leur variabilité s’inscrit dans des paramètres définis par l’auteur. En principe, tout utilisateur de l’Atlas faisant la même sélection de contenu et de forme de présentation verra un document identique ; donc, l’Atlas conserve virtuellement ces documents. Toutefois, ils ne peuvent être qualifiés de représentations du document d’archives parce que le système ne conserve aucune donnée concernant leur production. Il n’y a pas de date, pas d’identification du destinataire, ni aucune information concernant l’activité dans laquelle le document est produit pour la première fois.

On peut dire d’un document dynamique en mémoire, par exemple, un document qui stocke les saisies de l’utilisateur et les utilise dans des présentations ultérieures ou encore un document qui traite et présente, mais ne stocke pas, les données des utilisateurs ou d’autres sources externes, qu’il est toujours en train de créer un document représenté, mais sans jamais l’achever. Le document présenté pourrait être un document d’archives si les processus qui font qu’il est pour toujours en cours étaient achevés, ou s’il était supprimé de l’environnement dynamique et conservé dans une forme gelée. Toutefois, l’état final d’un document isolé d’une manière ou d’une autre de processus dynamiques ou insensible à ceux-ci serait statique. Mais produire un document statique de l’une ou l’autre manière reviendrait à créer un document différent. Il pourrait servir comme document d’archives du processus dynamique ou de son état au moment où il a été gelé, mais il ne pourrait pas remplir la finalité dynamique de produire un résultat variable en réponse à diverses entrées ou stimuli. Dans certains cas, le document dynamique en mémoire pourrait être conservé comme document d’archives mais ce ne serait pas possible dans le cas des documents appartenant à la catégorie 2.2.4 du Tableau 1.

L’étude de cas VanMap illustre les problèmes que pose la conservation des documents dynamiques comme archives. En l’état, VanMap ne conserve pas de documents d’archives mais pourrait être modifié pour le faire. Tant que les données sont écrasées par les mises à jour, leur agrégation telle qu’elle apparaît à un moment donné quelconque n’atteindra jamais le statut de document, encore moins de document d’archives. La combinaison de couches de données, de jeux de données et de jeux d’instructions, qui produit les affichages utilisés dans tout processus métier, peut être décrite comme un document instrumental de ce processus. Le système peut conserver ces documents quelque temps : il pourrait reproduire l’information utilisée dans une action particulière, dans la même forme et avec le même contenu que lorsque l’action a été accomplie mais seulement tant que les données ou les instructions qui contrôlent la forme de l’affichage n’ont pas été modifiées. Il devrait être possible de modifier la conception et le fonctionnement de VanMap soit pour produire des documents d’archives soit pour stocker les variations successives de données au cours du temps.

Être en mesure de conserver des documents d’archives dans le système utilisé pour accomplir les transactions est une nécessité lorsque celles-ci impliquent plusieurs étapes successives et que les systèmes en interaction supportent des transactions multiples pour lesquelles des documents de transactions antérieures sont nécessaires aux suivantes. Un système en interaction ne pourrait passer à l’étape ou à la transaction suivantes s’il ne contient pas de documents d’archives de l’étape ou de la transaction précédentes486. Ce qui ne signifie pas que le système doit être capable de reproduire les documents en utilisant la même fonctionnalité que celle qu’il a utilisée pour les produire au départ. Le système pourrait être conçu pour comporter un sous-système de conservation des documents d’archives en plus du sous-système ou du module utilisé pour les produire.

La deuxième possibilité pour conserver des documents d’archives dans des systèmes interactifs, expérientiels ou dynamiques est de les garder dans un système spécifiquement conçu à cette fin. On pourrait le faire soit en les sortant du système original et en les conservant dans un autre système adapté à l’archivage de documents, soit en ajoutant une fonctionnalité d’archivage des documents au système initial. Dans la mesure où les présentations de documents d’archives et les documents d’instructions sont produits par de tels systèmes, ils pourraient être conservés dans un format numérique approprié soit comme documents statiques soit comme documents à la variabilité limitée. Le projet InterPARES 2 ayant étudié des systèmes interactifs, expérientiels ou dynamiques mais non des systèmes d’archivage des documents d’archives, nous ne disposons pas d’étude de cas portant sur des systèmes distincts d’archivage des documents numériques. Le système VanMap produit bien des présentations de documents d’archives vers d’autres systèmes mais ce sont des sorties papier.

Conserver des documents numériques dans un système séparé ou dans un sous-système spécifiquement conçu à cette fin est nécessaire dans les cas où le système qui produit les documents n’a pas la capacité de reproduire les documents de manière fiable, en utilisant la fonctionnalité qui les a produits initialement. Mais un document sélectionné et conservé de cette manière comme document d’archives peut présenter des différences tant de forme que de contenu par rapport au produit initial. Ce document ne serait pas identique au produit réel du système, précisément parce qu’il en aurait perdu les propriétés interactives, expérientielles ou dynamiques. Cependant, il ne faut pas perdre de vue le fait que tous les documents d’archives sont des substituts : ils représentent ou prennent la place d’actions ou de faits. La capacité de reproduire ce que le système a présenté dans une représentation donnée, sans les attributs interactifs, expérientiels ou dynamiques de l’environnement dans lequel elle a été produite, peut être suffisante pour certains besoins de conservation des documents d’archives.

Une méthode consisterait par exemple à prendre un instantané ou à geler de toute autre manière une présentation produite par un système interactif, expérientiel ou dynamique. Ainsi d’un enregistrement audio statique d’une performance musicale ou d’un enregistrement audio/visuel d’autres formes de performance. Dans de tels cas, le document statique représenterait, mais ne répéterait pas à l’identique, la performance initiale.

Des objets statiques, durables, peuvent en fait être nécessaires pour satisfaire les besoins d’archivage du producteur. Un exemple de système interactif qui crée des documents statiques lorsqu’il interagit avec les utilisateurs pour répondre aux besoins d’archivage du producteur est celui d’une application de vente en ligne qui accumule les données qui lui sont nécessaires pour produire des ordres d’achat à partir des sélections et saisies des utilisateurs. Un autre exemple en serait un système dynamique utilisé pour exécuter un processus de fabrication. Il enregistrerait les variations – les différentes valeurs des données et les différents processus exécutés – qui surviennent à chaque exécution, et transmettrait ces informations dans un rapport. Dans ces exemples, les documents d’archives statiques sont des documents de transactions conçus par le système pour être acceptés. L’Atlas cybercartographique de l’Antarctique étant conçu pour fournir des informations plutôt que pour supporter des transactions, tout document produit par l’Atlas ne peut être un document d’archives pour ce qui est du système mais il pourrait par la suite être utilisé par le destinataire dans ses activités. Un utilisateur pourrait créer un document d’archives en collectant et acquérant des éléments de contenu qui pourraient être exportés de l’Atlas dans l’environnement de l’utilisateur ou, le cas échéant, imprimés.

Un même système peut avoir recours aux deux modes d’archivage qui viennent d’être décrits, qu’il supporte des interactions avec d’autres systèmes ou avec des utilisateurs humains. Par exemple, alors qu’un système qui exécute des transactions via des interactions avec d’autres systèmes conservera des copies des documents envoyés en tant que documents d’archives, il mettra de côté les documents reçus en tant que documents d’archives, garantissant ainsi que tous les documents d’archives sont dans le système où ils ont été créés. Le livre foncier d’Alsace-Moselle fait usage des deux premières possibilités pour conserver des documents d’archives. Il reproduit les documents des entrées actives en utilisant les mêmes capacités de XML et les mêmes bases de données que celles utilisées pour créer de nouvelles entrées de propriétés, et ses fonctionnalités ont été enrichies pour qu’il puisse conserver et récupérer les documents d’archives numérisés (images scannées) des entrées inactives.

La troisième possibilité de conservation des documents d’archives numériques concerne les documents instrumentaux. Dans la mesure où ils contribuent à produire les résultats ou les sorties prévus d’un système ou d’une application, il est vraisemblable qu’ils seront maintenus dans le système aussi longtemps que le système lui-même est maintenu.

L’Atlas cybercartographique de l’Antarctique dans sa globalité peut être décrit comme un document d’archives instrumental interactif et expérientiel du Geomatics and Cartographic Research Centre de l’université de Carleton, produit dans le cadre d’un projet de recherche financé par le Social Sciences and Humanities Research Council of Canada, qui a un lien archivistique avec les documents administratifs du projet.

Cependant, les systèmes interactifs, expérientiels ou dynamiques ne contiennent pas nécessairement des documents d’archives instrumentaux. Dans les systèmes dynamiques, même lorsqu’il est possible d’identifier un jeu de composants numériques qui semble être un document instrumental, si le système possède la capacité d’adapter son logiciel de manière autonome, l’objet comprenant ces composants numériques ne satisfera pas aux conditions requises élémentaires de contenu et de forme fixes. Dans de tels cas, il n’y a aucun moyen de rappeler ce qu’était le processus ayant produit un résultat ou une sortie donnés. D’où il s’ensuit que le système en question doit être modifié.

Dans VanMap, les objets qui existent dans le système pourraient être maintenus pour fournir des documents d’archives reflétant la situation observée par les décideurs à un moment donné. Suivant des méthodes éprouvées de gestion de bases de données, un journal des données dans le système pourrait être créé et conservé avant toute mise à jour, avec une description détaillée de chaque processus métier auquel participe VanMap et de la façon dont VanMap est utilisé par chacun d’eux, en plus des instructions utilisées pour créer les documents à l’appui de chaque type de transaction. La description indiquerait le lien archivistique entre les documents de chaque processus métier et VanMap, et les instructions révéleraient la relation spécifique qui existe entre chaque processus et les données qui l’ont supporté. Cela équivaudrait à incorporer, comme on le fait depuis des siècles, dans une procédure interne, la fonction d’un document d’archives servant des activités et des procédures multiples, mais dont il n’existe qu’un original (voir par exemple les séries de plans du cadastre, qui ont été et sont utilisés comme des documents dans plusieurs procédures à la finalité différente). Cependant, tel qu’il est conçu et géré actuellement, VanMap ne conserve des documents d’archives d’aucune transaction métier.

Une forme fixe et un contenu stable ne sont que deux des caractéristiques qu’un objet électronique doit présenter pour être considérée comme un document d’archives. Les objets qui sont des documents d’archives doivent aussi avoir des liens explicites avec d’autres documents, un contexte administratif identifiable ; un auteur, un rédacteur et un destinataire ; et une action, à laquelle participe le document ou qu’il soutient soit au niveau de la procédure soit dans le processus de prise de décision. Mais c’est là un sujet d’analyse et de discussion pour un autre article.

Conclusion

Le projet InterPARES a examiné différents sujets relatifs à la conservation de documents d’archives authentiques dans des systèmes d’information. Les caractéristiques des documents d’archives numériques en sont un. Appliquant et mettant à l’épreuve dans un grand nombre d’études de cas des concepts traditionnels issus de la diplomatique et de l’archivistique, le projet a étudié les similitudes et les différences que présentent les documents d’archives dans les systèmes électroniques – lorsqu’il en existe – par rapport aux documents d’archives traditionnels sur papier. Au cours de la première phase du projet, les études de cas se sont concentrées sur les équivalents numériques des documents traditionnels. Les caractéristiques empiriques les plus saillantes de ces documents sont que leur encodage numérique ne manifeste pas la forme documentaire du document d’archives et que, par conséquent, ils ne sont pas conservés en tant qu’objets mais en tant qu’un ou plusieurs trains de bits auxquels les ordinateurs doivent appliquer le traitement adéquat pour qu’ils soient dans la bonne forme documentaire. Dans sa seconde phase, InterPARES s’intéresse aux systèmes interactifs, expérientiels et dynamiques qui ne produisent ou ne conservent pas nécessairement quoi que ce soit qui corresponde à des documents d’archives traditionnels.

L’analyse de systèmes interactifs, expérientiels et dynamiques requiert d’établir une distinction précise entre les systèmes eux-mêmes, les interactions, expériences, performances et autres produits, et les objets qui y sont créés et/ou conservés. Dans de nombreux cas, les systèmes interactifs, expérientiels et dynamiques produisent des objets qui ont l’apparence de documents mais qui, après leur première présentation, ne peuvent être reproduits avec le même contenu et dans la même forme. étant donné la fonction mémorielle essentielle du document d’archives – un document d’archives est une trace d’activité conservée par son producteur à des fins de consultation ou d’utilisation dans une activité ultérieure –, ces cas ne semblent pas satisfaire la condition requise élémentaire de forme fixe et de contenu stable.

Cependant, les cas abordés dans cet article montrent que les systèmes interactifs, expérientiels et dynamiques peuvent produire des documents aptes à être conservés en tant que documents d’archives. Qui plus est, une étude plus poussée de ces systèmes montre qu’il arrive qu’ils contiennent des documents présentant une certaine variabilité de forme et de contenu mais que, cette variabilité étant dûment limitée, ils peuvent être considérés comme des documents d’archives – par exemple, lorsque la variabilité est due à la technologie et non à l’intention de l’auteur ou du rédacteur du document. En outre, auteurs ou rédacteurs peuvent générer des documents numériques qui intègrent une variabilité délibérée. Ainsi en va-t-il notamment de la construction de formes documentaires permettant aux utilisateurs de sélectionner des sous-ensembles de contenu et de contrôler l’ordre et les caractéristiques de présentation, comme par exemple la modification de la taille des images.

Il y a également des cas, surtout dans le domaine des arts mais aussi dans l’administration et en sciences, où les systèmes interactifs, expérientiels et dynamiques contiennent des documents dont la présentation ou la restitution montrent toujours une variation unique ou spontanée du contenu ou de la forme. Il convient ici de distinguer ce qui est produit par le système des documents qui permettent au système de produire ce qu’il produit. Ces documents sont dits « instrumentaux » : ils rendent possibles les interactions, expériences ou processus que le système exécute. Sous réserve qu’ils soient bien maintenus et gérés comme des éléments intellectuellement liés aux ensembles de documents d’archives, les documents instrumentaux peuvent être considérés comme des documents d’archives. à première vue, cette conclusion semble contredire celle d’InterPARES 1 selon laquelle un document d’archives numérique n’est pas quelque chose qui est conservé dans un système mais quelque chose qui est reproduit en traitant les objets de données stockés dans un système ; en fait, comme cela a été démontré, cette conclusion prolonge, plutôt qu’elle ne contredit, celle d’InterPARES 1.

Définir le concept de document d’archives dans le contexte de systèmes interactifs, expérientiels et dynamiques est, cela va sans dire, une tâche ambitieuse, tant il est vrai que cette définition dépend du point de vue retenu (envisage-t-on les objets numériques du point de vue de l’auteur/rédacteur, de l’utilisateur, du producteur ou du service d’archives ?) et du niveau d’abstraction concerné (envisage-t-on l’objet global ou les interactions de l’objet individuel en tant que document d’archives ?). Cependant, le but de cet article était de présenter le travail accompli par InterPARES sur le sujet et d’engager une discussion théorique. Aussi long soit-il, cet article ne fait qu’amorcer cette discussion. Le concept de document d’archives formulé ici doit être mis à l’épreuve dans d’autres environnements. Les possibilités concrètes de conserver de tels documents demandent à être explorées, en particulier dans le contexte d’autres apports majeurs à la conservation numérique, tels que le modèle OAIS, les projets CEDARS et CAMiLEON487, le standard METS488 et les métadonnées PREMIS. Il est incontestablement nécessaire d’explorer les implications pratiques et les conséquences juridiques majeures pour toutes les parties impliquées directement, et toutes les parties prenantes. Les auteurs espèrent que la discussion se poursuivra bien au-delà de la fin du projet InterPARES.

Annexe

Glossaire des principaux termes

Terme Définition
Données de composition Un des trois types de données numériques stockées utilisées pour produire ou reproduire un document numérique ; elles indiquent au système quelles données de forme et de contenu appartiennent à quels documents.
Données de contenu Un des trois types de données numériques stockées utilisées pour produire ou reproduire un document numérique ; elles constituent le contenu du document.
Composant numérique Un train de bits qui est nécessaire pour reproduire le document. Il peut comprendre des données de composition, de contenu ou de forme, ou une combinaison de ces types de données.
Données de forme Un des trois types de données numériques stockées utilisées pour produire ou reproduire un document numérique ; elles permettent au système de reproduire le document dans la bonne forme.
Document d’archives représenté La visualisation ou la matérialisation du document d’archives qui est produite à partir du/des composant(s) numérique(s) stocké(s) dans une forme adéquate pour la présentation à un être humain ou à un autre système.
Caractéristiques de présentation Un ensemble de caractéristiques perceptibles (graphiques, sonores, visuelles) générées par des instructions d’encodage et de programme, et capables, lorsqu’utilisées seules ou en combinaison, de présenter un message à nos sens.
Document d’archives en mémoire Un objet encodé sous forme numérique qui est géré comme un document d’archives.

412 Cet article a été publié pour la première fois dans Archival Science (2006) 6(1). Reproduit avec l’autorisation de l’éditeur.
413 Les auteurs remercient tout particulièrement Randy Preston, assistant de recherche associé au projet InterPARES 2, pour sa relecture attentive et ses critiques constructives. Certaines de ses suggestions ont été intégrées au texte de cet article.
414 NdT : les travaux du groupe InterPARES 2 ont été suivis par une nouvelle phase, InterPares 3 qui a débuté en 2007 et s’est achevée en 2012.
416 De nombreux projets se sont attachés à étudier les caractéristiques des documents numériques au sens large. Il faut en particulier citer le modèle de référence Open Archival Information System (OAIS) (http://public.ccsds.org/publications/archive/650x0b1.pdf). Plusieurs autres projets ont eu recours au modèle d’information formalisé dans la norme OAIS pour analyser les caractéristiques des documents numériques : CEDARS (http://www.leeds.ac.uk/cedars/), PREMIS (http://www.loc.gov/standards/premis/v2/premis-2-0.pdf) et le projet Persistent Archives (http://www.sdsc.edu/News%20Items/PR040904b.html) notamment. Il faut toutefois souligner que c’est dans la perspective de comprendre et d’apporter des réponses aux défis de la conservation des documents numériques que leurs réflexions ont été conduites. Or, le but du présent article est d’identifier les caractéristiques des documents numériques qui sont des documents d’archives. L’objectif est de décrire ces documents en tant que tels et de dépasser les seules considérations relatives à leur conservation.
417 La complétude n’est pas considérée ici comme une caractéristique du document d’archives parce qu’un document d’archives incomplet n’en est pas moins un document d’archives, bien qu’inachevé, mais comme une caractéristique d’une forme fixe, selon laquelle une forme qui est fixe est une forme qui ne perd aucun de ses éléments originaux au cours du processus de stockage et d’extraction.
418 La stabilité d’un document d’archives, telle que déterminée par sa forme fixe et son contenu non modifiable, est implicite dans la définition archivistique qui veut qu’un document d’archives soit un document (c’est-à-dire davantage que des données ou de l’information) mais est affirmée de manière explicite dans la définition et le concept diplomatiques du document d’archives. (Voir Luciana Duranti, Diplomatics. New Uses for an Old Science (Lanham, Marland and London : The Scarecrow Press, Inc., The Society of American Archivists and the Association of Canadian Archivists, 1998), pp. 41-58.)
419 Cette caractéristique correspond au lien archivistique, qui, pour être sous-entendue dans la définition archivistique lorsque la production des documents est liée à une activité, est rendue explicite par les théoriciens de l’archivistique de toutes époques et de toutes cultures. Voir Luciana Duranti, « The Archival Bond », Archives and Museum Informatics 11, n°3-4 (1997) : 213-218.
420 Alors que les caractéristiques 4 et 6 peuvent être déduites à partir de la définition archivistique, la caractéristique 5 découle du concept diplomatique de document d’archives : elle a été jugée importante en vue de distinguer les documents d’archives des objets numériques résultant d’une simple requête dans une base de données. L’auteur est la personne qui émet le document, le rédacteur est la personne qui compose le document et le destinataire/bénéficiaire est la personne à qui le document est destiné. Un document d’archives devant participer à une action et toute action devant revenir à quelqu’un, le destinataire/bénéficiaire est nécessaire à l’existence du document d’archives. Voir l’annexe 2 de l’ouvrage The Long-term Preservation of Electronics Records : the InterPARES Project sur le site web d’InterPARES : http://www.interpares.org/book/index.cfm. Ce livre est également disponible sous forme imprimée auprès de la Société des Archivistes Américains : Luciana Duranti (éd.), The Long-term Preservation of Electronic Records : the InterPARES Project (San Miniato, Italie : Archilab, 2005).
421 La raison pour laquelle les éléments constitutifs du document d’archives sont présents dans le modèle qui est censé représenter la forme idéale du document est que tous les éléments constitutifs identifiés étaient considérés par les diplomatistes traditionnels comme des caractères externes requis. Il était important d’exposer leur présence, leur définition et leur finalité, et le fait qu’ils sont désormais indépendants de la forme.
422 Dans le cadre d’un précédent projet de recherche, le projet UBC-DoD, les éléments constitutifs du document d’archives avaient été identifiés comme suit : support, forme, action, acteurs, lien archivistique, contenu et contexte. Voir Luciana Duranti et Heather MacNeil, « The Preservation of the Integrity of Electronic Records : An Overview of the UBC-MAS Research Project », Archivaria 42 (Printemps 1997) : 46-67 ; et Luciana Duranti, Terry Eastwood et Heather MacNeil, Preservation of the Integrity of Electronic Records (Dordrecht : Kluwer Academic Publishers, 2002) : Chapitre 1. Dans le contexte d’InterPARES, il a été jugé que l’action, les acteurs, le lien archivistique et le contexte, à la différence des autres éléments constitutifs, continuant de se manifester dans des éléments formels et étant inextricables de ceux-ci, ne doivent pas être identifiés séparément de la forme. En ce qui concerne les additions, qui, dans le projet UBC-DoD, faisaient partie des éléments de forme, elles ont été ajoutées aux éléments constitutifs parce qu’elles sont souvent liées au document d’archives, plutôt que contenues dans celui-ci, et nécessitent par conséquent d’être examinées séparément de la forme du document.
423 « Règles de représentation du contenu d’un document d’archives, de son contexte administratif, de son contexte documentaire et de son autorité. »
424 « Caractères d’un document d’archives qui renseignent sur l’action à laquelle participe le document, et son contexte immédiat. »
425 « Caractères d’un document d’archives qui déterminent son aspect extérieur. »
426 Voir « Template for Analysis », annexe 1, dans The Long-term Preservation of Electronic Records : the InterPARES Project, op. cit.
427 « Cadre de l’action à laquelle participe le document d’archives. »
428 Pour plus de détails concernant les additions et les contextes, voir le Template for Analysis mentionné plus haut.
429 « Ce qui porte physiquement le message. »
430 En disséquant le concept de document d’archives, l’objectif de l’équipe InterPARES était également d’identifier les éléments ou caractères contribuant à son authenticité et permettant de la vérifier.
431 Il peut y avoir des différences mineures entre la forme dans laquelle un document utilisé pour des interactions entre systèmes, et non représenté à un être humain, est stocké sur un support numérique et la forme dans laquelle il est utilisé dans des transactions automatisées ; il n’en demeure pas moins vrai que la façon dont les données numériques qui constituent le document sont inscrites sur un support physique quel qu’il soit et que la forme dans laquelle elles sont transmises entre systèmes ou la forme dans laquelle elles sont stockées dans la mémoire d’un ordinateur pendant des interactions, ne sont jamais identiques. En revanche, un document traditionnel, analogique, est inscrit sur le papier et transmis et lu exactement dans cette forme.
432 « Présentation » désigne ici l’action de matérialiser les caractéristiques de présentation générales et spécifiques d’un document d’archives numérique ou le résultat de cette action.
433 NdT : il s’agit de ce qu’on appelle ordinairement le type de documents ou la typologie documentaire.
434 Une propriété fondamentale, ou attribut, du caractère « sceau » sera par exemple sa légende.
435 Un profil de document est une addition inextricablement liée au document qui comprend plusieurs champs, qui sont automatiquement ou manuellement renseignés avec les métadonnées du document.
436 Les œuvres d’art et les enregistrements de représentations artistiques sont généralement considérés comme le produit d’activités artistiques, plutôt que comme des documents d’archives. Toutefois, la définition archivistique traditionnelle du « document d’archives » ne comporte aucune restriction quant au type d’objet informationnel concerné. Sous réserve qu’ils satisfassent aux conditions requises du document d’archives résumées en Section 1, une œuvre d’art ou l’enregistrement d’une performance artistique peuvent être des documents d’archives.
437 IEEE. Standard Glossary of Software Engineering Terminology. In IEEE Software Engineering Standards Collection. IEEE, 1990 ; Std 610.12-190
439 Naturellement, des responsables/employés de la banque sont impliqués dans la production du document de la transaction en ce sens qu’ils sont responsables de l’élaboration et de la mise en œuvre des politiques et procédures de la banque en matière de distributeurs automatiques (ils sont par là même les rédacteurs de fait du document). Ils veillent également à ce que ces politiques et procédures soient traduites dans un système qui, à son tour, produit des documents de transaction pertinents en réponse aux actions/requêtes de l’utilisateur.
440 Une nouvelle fois, il y a intervention humaine en ce sens que les rédacteurs et auteurs compétents des documents ainsi que leurs destinataires, sont tous des êtres humains, non des ordinateurs.
441 Clifford Lynch. « Authenticity and Integrity in the Digital Envrionment : An Exploratory Analysis on the Central Role of Trust. » In Authenticity in a Digital Environment (Washington, D.C. : CLIR, 2000), pp. 32-50, disponible sur http://www.clir.org/pubs/reports/pub92/pub92.pdf.
442 Ramesh Jain. « Experiential Computing. » Communications of the ACM 46 (7) (2003): 48-54.
443 Seamus Roos. 2000. Changing Trains at Wigan : Digital Preservation and the Future Scholarship. London : NPO Preservation Guidance Occasional Papers.
444 Summit Strategies. The 2005 Summit Seven : Dynamic Computing Gets Down to Business. Market Stratgey Report 4EC-07. Décembre 2004, disponible sur http://www.summitsrat.com/store/4ec07detail.
445 A.E. Eiben et J.E. Smith. Introduction to Evolutionary Computing (Berlin : Springer, 2003).
446 Janos Spztipanovits, Gabor Karsai et Ted Bapty. « Self-adaptative software for signal processing : Evolving systems in changing environments without growing pains », Communications of the ACM 41 (5) (1998) : 66.
447 Narinder Singh. « Unifying heterogeneous information models : Semantic tags support knowledge webs », Communications of the ACM 41 (5) (1998) : 37.
448 Jeff Sutherland et Narinder Singh. « Application integration and complex adaptative systems. Association for Computing Machinery », Communications of the ACM 45 (10) (2002) : 59-64.
449 La distinction entre ces trois attributs/systèmes reste un sujet de débat parmi les chercheurs d’InterPARES, leur définition étant plus arbitraire et subjective que logique et objective. Comme nous l’avons déjà souligné, les systèmes expérientiels et dynamiques sont des types particuliers de systèmes interactifs. Cependant, eu égard à la nécessité de les compartimenter, une autre façon de les différencier est le degré d’implication directe et en temps réel de l’utilisateur humain, les systèmes expérientiels et dynamiques étant alors situés aux deux extrémités du spectre, et le système interactif quelque part entre les deux. De fait, sur la base des définitions que nous avons données, il semble que la seule véritable différence entre les attributs interactifs et expérientiels est que seul ce dernier requiert ipso facto une implication directe, en temps réel, de l’utilisateur humain. On est donc fondé à se demander si les distinctions subtiles, largement subjectives, entre ces trois types d’attributs de systèmes sont : (a) réelles et exploitables, (b) nécessaires, ou (c) en fin de compte, utiles.
450 Comme l’a établi la première phase d’InterPARES, on peut dire d’un système informatique qu’il contient un document numérique lorsqu’il a la capacité de reproduire ce document. Une façon de faire, mais non la seule, est de stocker ce document sous la forme d’un objet unique de données.
451 NdT : les termes suivis d’un astérisque sont définis dans le glossaire en fin de document.
452 La littérature archivistique décrit souvent les documents d’archives comme constitués d’un contenu, d’un contexte et d’une structure. La discussion ci-dessus décrit la relation des trois types de données au contenu et à la structure mais pas au contexte. En effet, comme cela a été souligné dans la Section 1, le contexte significatif est extérieur au document. Il est constitué par les relations du document avec d’autres documents, l’environnement administratif dans lequel le document est produit et maintenu, l’action à laquelle il participe et les personnes impliquées dans sa production. Une partie du contenu d’un document peut indiquer ou révéler son contexte ; néanmoins, il est composé de données de contenu.
453 NdT : décision rendue par le juge du livre foncier.
454 Jean-François Blanchette, Françoise Banat-Berger et Geneviève Shepherd, Computerization of Alsace-Moselle’s Land Registry, Étude de cas InterPARES CS18. 21 septembre 2004. Voir également : http://www.interpares.org/display_file.cfm?doc=ip2_alsace_characterization.pdf. Cet article est également disponible en français : http://www.cairn.info/revue-document-numerique-2004-2-page-63.htm.
455 The Long-term Preservation of Authentic Electronic Records : Findings of the InterPARES Project, consultable sur : http://www.interpares.org/book/interpares_book_f_part3.pdf, p. 6.
456 Ibid. pp. 7-8. Pour une discussion plus détaillée, voir « How to Preserve Electronic Records, Appendix 6 » in The Long-term Preservation of Authentic Electronic Records : Findings of the InterPARES Project, consultable sur : http://www.interpares.org/book/interpares_book_o_app06.pdf.
457 Si le système conserve un historique, la bonne question à se poser n’est pas nécessairement de savoir si le système peut reproduire chaque séquence et chaque conséquence de tout processus « input ==> calcul ==> output », mais plutôt si le système peut reproduire seulement celles des séquences et/ou conséquences qui correspondent à ce que l’utilisateur (ou l’auteur/système, selon la perspective retenue) identifie comme documents/documents d’archives correspondant à l’interaction de l’utilisateur avec le système.
458 Les musicologues restent partagés sur le fait de savoir si la partition constitue aussi une œuvre musicale à part entière, mais cela n’invalide pas les idées présentées ici.
459 L’environnement numérique permet à un artiste d’enregistrer une œuvre d’art dans différentes formes documentaires. Outre les documents permettant la représentation et l’enregistrement de celle-ci, l’étude de cas InterPARES Waking Dream s’appuie sur un site web que son auteur considère comme faisant partie intégrante de l’œuvre et qui inclut le « script » avec les informations sur l’espace de la représentation et les gadgets utilisés, les notices biographiques des artistes ainsi que des vidéos et des images de représentations. La page web est un document dont les composants numériques comprennent la page web elle-même et les objets accessibles à partir de celle-ci, comme la documentation sous forme textuelle, les enregistrements audiovisuels de représentations réelles, et des échantillons de photos des images projetées pendant le spectacle. Le code informatique n’est ni inclus ni décrit sur le site web. La page web n’est ni un enregistrement d’une représentation de Waking Dream ni un document permettant la représentation, comme par exemple le texte d’une pièce de théâtre ou la partition pour une œuvre musicale. C’est une autre forme de présentation de l’œuvre. Pour une description complète de l’étude cas, voir : http://www.interpares.org/display_file.cfm?doc=ip2_waking_dream(complete).pdf. La page web de Waking Dream illustre un troisième type de document expérientiel, qui permet à un utilisateur de faire l’expérience d’une œuvre en interagissant avec le système : la nature de l’interaction est en fait plus active que passive, ou plus participative que de l’ordre de l’observation. C’est une forme plus complexe de système interactif, incluant possiblement des types hétérogènes de données et, proportionnellement, des possibilités plus variées pour présenter ces données, et offrant davantage de souplesse ou de finesse dans la réponse à l’action de l’utilisateur.
461 Par exemple, Obsessed again..., un morceau de musique interactif pour basson et ordinateur, du compositeur canadien Keith Hamel. Voir : http://www.interpares.org/display_file.cfm?doc=ip2_obsessed_again(complete).pdf.
462 InterPARES 2, Rapport final sur l’étude de cas Waking Dream, op. cit.
463 David Reim. « Online behavior : A brand builder’s best friend », Pharmaceutical executive 22 (4) (2002) : 104-108.
464 Dans ce cas et dans de nombreux cas similaires, la solution la plus prometteuse et la plus faisable à l’absence d’un objet clairement identifiable qui puisse être préservé en tant que document est d’établir des points intermédiaires d’ « arrêt » (ils pourraient être prédéfinis ou choisis au hasard pour faciliter l’analyse statistique des résultats, si on le souhaite, ou être déclenchés chaque fois qu’un jeu prédéterminé de critères d’interaction utilisateurs sont remplis, etc) dans le processus en cours, lorsque des documents sont produits qui attestent de l’état du système aux points en question.
465 Naturellement, il ne faut pas en déduire que le contenu et la forme sont des objets uniques créés à la volée à partir d’un réservoir infini de possibilités, puisque ce sont simplement des présentations de combinaisons prédéterminées de contenu et de forme qui sont ensuite sélectionnées à partir d’un réservoir fini de telles combinaisons, en réponse au comportement de l’utilisateur.
466 Jusqu’à un certain point, c’est précisément ce que fait l’historique d’un navigateur web, que les utilisateurs peuvent reproduire en utilisant les flèches « précédent » et « suivant » du navigateur.
467 Parce que les documents dans lesquels la performance est saisie sont « statiques » et/ou incapables de capturer tous les aspects de la représentation réelle, ils intègrent ipso facto une variabilité moindre que ne l’autorisent les règles décrivant les composants, le contexte, les conditions préalables ou d’autres conditions requises pour la représentation.
468 Cette approche va un peu plus loin que la définition de « expérientiel » retenue par les chercheurs d’InterPARES, qui recouvre seulement les « expériences sensorielles ». Or, de toute évidence, une expérience peut être intellectuelle ou affective, aussi bien que sensorielle.
469 Nicola Ferrier, Simon Rowe et Andres Blake, « Real-Time Traffic Monitoring », In Proceedings of the 2nd IEEE Workshop on Applications of Computer Vision, Sarasota, Florida, 5-7 December 1994, pp. 81-88, consultable sur : http://ieeexplore.ieee.org/iel2/998/7985/00341292.pdf. Noël Baisa, « Designing Wireless interfaces for patient monitoring equipment », RF Design, April 2005 : 46-54, consultable sur : http://www.rfdesign.com/mag/504rfdf4b.pdf.
470 Pour un exposé plus détaillé de l’étude de cas VanMap, voir : http://www.interpares.org/display_file.cfm?doc=ip2_vanmap_characterization.pdf.
471 NdT : néologisme formé à partir des mots education et entertainment. Désigne différentes formes de divertissement conçues pour éduquer tout en amusant.
472 Dale Thomas. « Aesthetic selection of morphogenetic art forms », Kybernetes 32 (1-2) (2003) : 144-155.
473 On pourrait avancer que les documents dynamiques ne sont pas nécessairement un sous-ensemble des documents interactifs. On peut imaginer des documents dynamiques qui ne comprendraient aucune caractéristique interactive mais généreraient des affichages variables à partir d’algorithmes qui se modifient eux-mêmes. Il serait alors toutefois plus pertinent de parler de pseudo-documents, voire d’applications, que de documents.
474 NdT : programme java qui peut-être attaché à une page web.
475 « Auteur » et « rédacteur » sont utilisés ici au sens de la diplomatique. Voir note 7. Lorsqu’un auteur est un individu, ce n’est généralement pas la même personne que le rédacteur. Lorsque l’auteur est une organisation ou une entité collégiale ou collective, le rédacteur est la/les personne(s) qui formule (nt) par écrit sa /leur volonté, généralement le(s) signataire(s).
476 Il arrivait que la date soit inscrite au dos du support, et non sur le coin.
477 Techniquement, le tout premier était un original alors que les suivants étaient des duplicata, bien qu’ils aient la force d’un original. Cependant, comme ils étaient tous produits directement à partir de la brève et non dérivés les uns des autres, et, comme, ayant une date de transmission différente et, possiblement, un rédacteur différent (un notaire qui avait légitimement pris la succession du notaire d’origine) et un destinataire différent (le destinataire de l’action demeurait le même mais le destinataire du document pouvait être un descendant d’une des parties originales), c’était des documents différents, ils peuvent en fait tous être considérés comme des originaux.
478 Il y a une distinction subtile mais importante ici qui rend la correspondance avec l’analogie médiévale moins exacte. Les documents numériques ne sont pas stockés dans des formes documentaires qui sont différentes de celles prévues originellement ; ils sont stockés dans des formes qui sont différentes des formes dans lesquelles ils ont été créés. Les brèves (nonobstant le fait que ce sont des documents complets en tant que tels) sont, dans un sens, des documents incomplets « remplaçants » de documents de transaction complets qui, dans la plupart des cas, n’ont jamais été créés. C’est un processus différent qui intervient dans le cas des documents numériques parce que ceux-ci sont, en fait, créés comme des documents complets dans leur forme définitive, et puis sauvegardés dans une forme qui diffère de la forme dans laquelle ils ont été créés. Dès lors, à la différence des « documents à venir » potentiels qui sont associés au système des brèves, les produits des systèmes numériques dont il est question ici sont des documents complets créés dans leur forme finale avant d’être stockés (sauf dans les cas où, comme nous l’avons évoqué, les conditions requises minimales pour un document numérique ne sont pas réunies).
479 Les travaux futurs sur la répartition des différents types de données en composants numériques devront étudier la façon dont le système reconnaît et traite les différents types de données dans différentes mises en correspondance.
480 Cette analyse, toutefois, ne serait que partielle. Il est également nécessaire de déterminer si les conditions requises de contexte, d’action, d’acteurs, de lien archivistique et de caractères internes de forme sont remplies.
481 Les documents d’archives prospectifs n’en conservent pas moins la fonction élémentaire de mémoire : ils rendent possibles des actions ultérieures et permettent aux acteurs de savoir quoi faire et/ou comment le faire conformément à des décisions antérieures.
482 À strictement parler, le code informatique n’est pas stocké dans la forme dans laquelle il contrôle ou façonne les processus. Il doit être traduit en code machine au moment de l’exécution mais cette traduction est analogue à la traduction d’une partition en signaux traités par le cerveau humain pendant l’exécution de l’œuvre musicale.
483 Cette situation est inversée lorsque ce type de documents d’archives n’est plus nécessaire au producteur. Pour qu’un être humain puisse comprendre ce que faisaient ces documents dans leurs contextes technologique, documentaire et administratif d’origine, il est nécessaire de les convertir dans une forme lisible par l’être humain à partir de la forme dans laquelle ils étaient stockés et fonctionnaient en tant que documents d’archives ; par exemple, des instructions doivent être converties de la forme binaire dans laquelle elles étaient exécutables en une forme textuelle. Dans la plupart des cas, cette conversion impliquera la traduction d’un langage machine en un langage lisible par l’être humain.
484 Le rapport d’InterPARES 1 suggérait une autre possibilité, celle d’échanger les caractéristiques de stabilité du contenu et de fixité de la forme du document (y compris la complétude de forme et de contenu quant à la première puis à toutes les représentations ultérieures du document) contre la capacité du système le contenant de garder trace et préserver toute modification du document. Voir http://www.interpares.org/book/interpares_book_d_part1.pdf, p. 24. En d’autres termes, les chercheurs étaient enclins à substituer aux conditions requises de stabilité et de fixité du document l’historique des modifications apportées au document une fois que celui-ci n’est plus nécessaire au producteur ; dans ce contexte, l’objet identifié en tant que document et à conserver intact serait alors la dernière représentation de l’objet, assortie du journal complet des modifications, et des métadonnées des deux. Cette option est conceptuellement valide seulement si le producteur utilise ce jeu d’objets comme son document d’archives, mais ce scénario est très improbable parce qu’il serait très peu pratique.
485 Tracey P. Lauriault, Peter Pulsifer et D.R. Fraser Taylor. The Cybercartographic Atlas of Antarctica Project. Voir http://www.carleton.ca/gcrc/caap.
486 On pourrait avancer qu’un tel système n’a pas nécessairement besoin de maintenir des documents d’archives des étapes précédentes d’un processus ou de transactions antérieures mais qu’il suffirait que le système conserve les données concernant ces étapes ou transactions. Cependant, si un tel système ne satisfait pas manifestement aux conditions pour conserver des documents, on ne saurait s’y fier durablement dans la conduite d’une activité.