[p. 123] Le Thesaurus Diplomaticus, un instrument de travail pour une nouvelle approche en diplomatique médiévale
Le 7 mai 1837, la Commission royale d’Histoire prit la décision de dresser un répertoire des documents diplomatiques intéressant l’histoire du jeune État qu’était alors la Belgique. Le promoteur de l’entreprise, L.P. Gachard, archiviste général du Royaume, reconnaissait s’inspirer d’ouvrages français, la Table chronologique de Bréquigny, et allemands, les Regesta regum atque imperatorum de Boehmer.
Alphonse Wauters, le premier, puis Stanislas Bormans, Joseph Halkin et enfin Jean-Jacques Hoebanx répertorièrent, classèrent, inventorièrent, débusquèrent les actes édités ou réédités dont les analyses classées chronologiquement devaient former les 16 volumes de la Table Chronologique des chartes et diplômes imprimés concernant l’Histoire de la Belgique, parus de 1866 à 1971.
160 ans plus tard le Thesaurus Diplomaticus entend succéder à la Table chronologique. Les lourds volumes in folio et leurs subtils addenda, mises à jours et suppléments ont fait place à un médium nouveau parfaitement adapté à la création et à la consultation d’un répertoire de regestes et autorisant une actualisation permanente des données : le CD-Rom.
Le Thesaurus Diplomaticus est le fruit d’une collaboration étroite entre le Cetedoc, laboratoire d’informatique en sciences humaines de l’Université catholique de Louvain, le Comité National du Dictionnaire du Latin Médiéval, maître d’oeuvre de la participation belge au Nouum Glossarium Mediae Latinitatis élaboré dans le cadre de l’Union Académique Internationale et la Commission Royale d’Histoire. Le département d’histoire de l’Universiteit Gent a mis à la disposition du projet sa collection photographique d’originaux diplomatiques.
La synergie entre ces institutions n’auraient pu se réaliser sans la compétence et la diplomatie des deux responsables scientifiques du projet : le professeur Paul TOMBEUR de l’Université catholique de Louvain, directeur du CETEDOC, et le professeur Walter PREVENIER de l’Universiteit Gent.
La mise en commun des ressources a permis la réalisation d’un instrument de travail bien plus complet qu’un simple répertoire d’analyses. Le CD-Rom que j’ai l’honneur de vous présenter offre ainsi la possibilité d’interroger et de consulter à la fois les textes latins diplomatiques, leur tradition manuscrite, les références bibliographiques précises, les regestes, les lieux, les dates, les [p. 124] auteurs, les disposants, les bénéficiaires et/ou les destinataires, les collationnements réalisés sur les originaux et les originaux eux-mêmes pour autant que nous disposions du document photographique leur attenant. Ce Thesaurus Diplomaticus se présente dès lors à la fois comme un outil pour l’étude du vocabulaire juridique, économique et technique de l’époque, comme un instrument permettant toute interrogation de type documentaire et comme un moyen privilégié pour une formation et des recherches paléographiques.
Le logiciel développé pour le Thesaurus Diplomaticus constitue l’adaptation et le développement du logiciel conçu par le CETEDOC pour les bases de données textuelles publiées sous le titre Cetedoc Library of Christian Latin Texts. Ce logiciel est actuellement repris par les Monumenta Germaniae Historica et par l’Irish Royal Academy : les chercheurs pourront ainsi facilement passer d’une base de données textuelle à une autre. On s’est efforcé de respecter au maximum la spécificité des documents diplomatiques et on a intégré dès lors les modules d’interrogation propres aux chartes. Le logiciel propose un système d’Aide à l’écran qui, outre les traditionnelles explications des fonctionnalités du programme, permet l’accès aux tables de renvoi et aux bibliographies des sources imprimées et inédites accompagnant le Thesaurus Diplomaticus.
Un projet comparable au Thesaurus Diplomaticus, suivant partiellement les mêmes critères d’informatisation des données critiques est en cours de réalisation au sein de l’atelier diplomatique ARTEM de l’Université de Nancy II. Il concerne les actes originaux antérieurs à 1123 conservés dans les dépôts d’archives français.
Le Thesaurus Diplomaticus est organisé en deux bases de données :
La base documentaire contient l’analyse des documents diplomatiques, édités ou inédits. La notice documentaire propose la datation du document, l’analyse de son action juridique et signale les éventuels originaux et copies constituant sa tradition manuscrite, ainsi que les éditions parues depuis 1907 et les renvois aux volumes de l’ancienne Table Chronologique.
La base textuelle reprend le texte complet des documents analysés pour autant qu’ils aient fait l’objet d’une édition.
Les bases documentaire et textuelle sont complétées par une “banque d’images” regroupant les photographies des originaux. Les territoires inclus dans le Thesaurus Diplomaticus sont ceux des Pays-Bas méridionaux ou plus précisément ceux des diocèses de Liège, Thérouanne, Tournai, Cambrai et Arras au 11e siècle, de l’archidiocèse de Trèves pour les terres mouvant des comtés de Chiny et d’Arlon qui relèvent de son autorité, de l’abbaye de Stavelot-Malmedy et du grand-duché de Luxembourg dans ses frontières politiques actuelles. Il faut y ajouter les territoires des provinces néerlandaises du Brabant septentrional, de Gueldre et de Zélande dépendant au 12e siècle de principautés belges.
[p. 125] Le cadre géographique concerné comprend donc les territoires du comté de Flandre y compris l’Artois et les comtés dépendants, le duché de Brabant, la principauté de Liège, le duché de Limbourg, les comtés de Namur et de Hainaut, le duché de Luxembourg.
La base textuelle est constituée par les documents rassemblés par le Comité national du Dictionnaire du Latin médiéval pour la réalisation de la partie du Novum Glossarium Mediae Latinitatis ou “Nouveau Du Cange” concernant la Belgique. Elle se limite actuellement aux actes des princes et des institutions de la Belgique et du grand-duché de Luxembourg auxquels sont joints les actes des évêques de Cambrai.
Le nombre de documents analysés dans la base documentaire (12800) est donc supérieur à celui des textes contenus dans la base textuelle (6000). De même, certains documents originaux dont nous mentionnons l’existence dans la notice documentaire n’ont pu encore être photographiés.
Le Thesaurus Diplomaticus couvre actuellement la période allant de 640 à 1200, tant pour la base documentaire que pour la base textuelle.
Le Thesaurus Diplomaticus offre une fonction de recherche qui permet d’interroger le texte des analyses des documents (Base Documentaire). Quels sont les documents dont l’analyse contient le mot “franchise” ?, les formes attestées dans les textes latins (Base Textes), isolément ou en association, Quels sont les textes qui contiennent la forme scabinus ou l’expression iudicio scabinorum ? ou encore en fonction des parties du discours diplomatiques : Quels sont les documents dans l’eschatocole desquels apparaît l’expression “coram scabinis” ?
Les filtres de l’outil de recherche permettent d’interroger les bases de données de manière chronologique : Quels sont les documents délivrés ou reçus en 1199 ?, de manière topographique : Quels documents concernent la ville de Gent ?, de manière onomastique : Quels document ont été délivrés par le comte de Flandre Baudouin IX ?, et de coupler instantanément ces informations : Quels sont les documents donnés en 1199 par le comte de Flandre Baudouin IX pour la ville de Gent ? Quels sont les documents donnés par un comte de Flandre dont le texte latin contient le mot theloneum ?
Les réponses obtenues révèlent le nombre de documents qui correspondent à la question posée. Elles sont affichées sous forme abrégée et classées dans l’ordre chronologique. Une réponse abrégée est constituée de l’analyse du document (Base Documentaire) ou de la forme demandée accompagnée de son contexte (Base Textes), précédées de deux lignes de références. Les formes, ou groupe de formes, demandées et contenues dans l’analyse ou le texte latin d’un document apparaissent en surbrillance.
[p. 126] À partir de ces réponses abrégées, il est possible de visualiser la notice documentaire complète d’un acte ainsi que le texte latin complet et une photographie de l’original si elle est disponible.
Les résultats obtenus peuvent être imprimés ou sauvegardés sur un support magnétique (disque dur ou disquette). Mais il me serait impossible de vous expliquer plus en détail les possibilités du Thesaurus Diplomaticus sans avoir recours à ce nouveau démiurge que certains exècrent, et je le conçois aisément parfois : l’ordinateur. Aussi vais-je vous proposer une courte présentation des fonctionnalités du programme.
Un premier écran d’accueil s’affiche, suivi de l’écran permettant le choix de la langue de travail souhaitée : français, néerlandais, anglais. Le logiciel demande ensuite à l’utilisateur de spécifier la base de données qu’il désire interroger : la Base Documentaire est composée des notices documentaires des actes, la Base Textes des textes latins des documents.
La Fiche constitue la zone principale de l’écran du Thesaurus Diplomaticus. On y accède en sélectionnant l’onglet qui lui correspond. Les critères de recherche sont entrés au niveau de la fiche Recherche (fig. 1). La réponse peut être délivrée sous forme abrégée (Fiche Réponse, fig. 2) ou sous forme complète [(Fiche Notice, fig. 3) et (Fiche Texte/Image, fig. 4)].
L’utilisateur peut choisir de formuler directement une question en saisissant directement dans un champ de recherche le mot ou le groupe de mots à rechercher ou d’utiliser les écrans Index et Listes de sélection afin de sélectionner ou de désélectionner une ou plusieurs entrée(s) du champ de recherche. L’écran “Index” permet l’affichage de toutes les formes ou entrées qui constituent le contenu des champs de recherche de la Base Documentaire et de la Base Textes. L’écran “Liste” permet l’affichage d’une sélection d’entrées extraites de l’index d’un champ de recherche. Cette liste de sélection correspond à la question posée dans le champ de recherche concerné par la liste. Le champ de recherche Date retenue permet d’accéder à la date à laquelle un document est classé dans le Thesaurus Diplomaticus. Elle sera toujours la date à laquelle un acte a été délivré ou prétend avoir été délivré. Les actes faux, interpolés ou rénovés seront donc classés à la date qu’ils portent ou à laquelle on considère qu’ils prétendent, tandis que les dates de falsification, interpolation ou rénovation seront mentionnées parmi les dates secondaires réunies dans le champ de recherche Pluri-dates.
Le système utilisé pour noter de façon compatible avec un traitement informatique la ou les dates attribuées à chaque document est simple : une date se compose toujours de 9 positions divisées en 4 éléments. Les 4 premières positions désignent le millésime, les 2 positions suivantes (de 01 à 12) indiquent le mois, puis 2 positions (de 01 a 31) spécifient le jour, la dernière position est un code de justification de la date. Au cas où le jour et/ou le mois font défaut, [p. 127] les positions où ils devraient figurer sont remplies par 9. L’aide en ligne donne accès à la résolution des codes de justification utilisés.
Le champ de recherche Pluri-dates propose l’ensemble des dates proposées par l’érudition historique pour un document. La date choisie comme date de classement (Date retenue) figure également parmi ces dates ainsi que les dates de falsification, de rédaction ou d’interpolation.
Le champ de recherche Auteur-Disposant permet d’accéder à la liste des noms d’auteurs et de disposants ou à la liste des formes qui les composent. Le champ de recherche Bénéficiaire permet d’accéder à la liste des noms des bénéficiaires ou à la liste des formes qui les composent. Il faut entendre par Bénéficiaire : le bénéficiaire et/ou le destinataire en faveur de qui l’action juridique est faite et pour qui le document constitue un titre.
Comme pour la datation des documents, un système de codage a été utilisé pour noter l’auteur d’un acte, le disposant, le bénéficiaire et/ou le destinataire : tout nom d’auteur, de disposant, de bénéficiaire ou de destinataire est codé en trois zones.
La première zone comporte un code, basé sur les termes latins en deux positions indiquant la fonction de la personne ou le type d’institution concernée.
À la deuxième zone correspond la localité, le pays ou la région attachée à la fonction de la personne ou le lieu où une institution est située. Les noms de pays et de régions ont été francisés (Flandre, Angleterre, Hollande, …). Les noms de localités par contre sont indiqués dans la langue du pays ou celle de la région. Pour les régions bilingues ou “à facilités linguistiques”, nous avons indiqué le nom de lieu dans les deux langues utilisées.
La troisième zone concerne le nom du personnage et contient aussi d’éventuels renseignements complémentaires (fils de, épouse de, frère de, etc.). Les toponymes mentionnés dans le champ de recherche Lieu identifié permet d’accéder à la liste des lieux énoncés dans l’eschatocole du document ou à la liste des formes qui les composent. Le champ de recherche Analyse ou régeste consiste en une brève description, aussi concise et précise que possible, du contenu juridique et historique de l’acte. Les toponymes cités dans l’acte sont en principe repris dans le régeste sous leur forme actuelle exprimée dans la langue usuelle du lieu. Mais lorsque leur liste dépassait par la longueur de son énoncé l’espace attribué au régeste, nous avons simplement noté le mot énumération mis entre parenthèses. Les termes techniques et les noms de lieux dont la traduction ou l’identification peuvent prêter à discussion, sont maintenus sous la forme qui est la leur dans le document (entre guillemets).
La mention du mot [Original] en fin d’analyse indique qu’une photographie de l’original est consultable dans la Fiche Texte/Image.
La mention du mot [Texte] en fin d’analyse indique que le texte latin du document est consultable dans la Fiche Texte/Image.
[p. 128] La mention du mot [Texte collationné sur …] en fin d’analyse indique que l’édition du texte latin utilisée par le Thesaurus Diplomaticus a été collationnée. L’item “Liste des collations” permet d’accéder, dans l’aide à l’écran, à la liste complète des collations.
La date retenue DLMD est la date à laquelle un document a été réellement confectionné. Les actes faux, falsifiés, interpolés, rénovés, les forgeries et les actes supposés seront donc classés à la date à laquelle ils ont été falsifiés, interpolés, rénovés ou forgés. Le champ de recherche Genre-Tradition permet d’interroger les documents selon le genre diplomatique du texte (Genre) et la source principale de l’édition (Tradition). Le champ de recherche Forme permet d’interroger les formes (unités susceptibles d’entrer sous un lemme ou unité lexicale) des textes latins. En unissant tous les textes dans un même corpus, nous devions nous en tenir aux maillons les plus faibles de notre chaîne et renoncer, à notre grand regret, aux signes critiques variés et variables employés par les meilleures éditions. Par contre, dans la mesure du possible, nous avons privilégié les leçons de l’original. Les termes utilisés dans un champ de recherche peuvent contenir des caractères génériques. Ces caractères permettent une recherche sur les formes dérivées.
Les caractères génériques utilisables sont les suivants :
“*” désigne n’importe quel ensemble de caractères ou l’absence de caractères. L’astérisque peut être assimilé à un caractère spécial signifiant ‘remplacez-moi par zéro ou plusieurs occurrences de n’importe quel caractère’. Il doit être employé avec discernement car il est générateur de bruit.
“?” désigne un caractère, n’importe lequel (mais non l’absence de caractère).
Le système d’interrogation du Thesaurus Diplomaticus intègre les trois opérateurs booléens [ET], [OU] et [NON]. Ces opérateurs de connexion mettent en relation les différents champs de recherche et peuvent être utilisés à chaque niveau d’interrogation.
L’informatique en science humaine a au moins un mérite : elle invite, ou contraint, le chercheur à multiplier les hypothèses. Nous espérons que notre travail, s’il ne prétend pas fournir les vraies réponses, aidera à poser les vraies questions à la documentation historique.
[p. 129] [p. 130] [p. 131] [p. 132]