La correspondance du chancelier Antoine Du Bourg, schéma de balisage
[CD] Camille Desenclos (École nationale des chartes) : conception et maintenance
Ce schéma spécifie les particularités d'un corpus TEI des éditions électroniques de l'École des chartes (ELEC) : la correspondance du chancelier Antoine du Bourg.
Il importe plusieurs autres schémas partagés par d'autres corpus :
acte.rng — Les aspects requis pour tout acte ELEC.
texte.rng — Des modèles de contenus réutilisables pour des corpus autres que des chartes.
teiHeader.rng — Entête fixée de contenu pour tout fichier TEI.
La particularité d'un corpus de correspondances concerne généralement :
Analyse diplomatique — La définition des métadonnées requises dans le cartouche d'entête: dates, titre, sommaire, tableau de la tradition.
Corps de la dépêche — La finesse et le type de balisage de la dépêche (parties du discours diplomatique, paléographie...)
Index — L'index ou glossaire contenant l'identification de noms de lieux ou de personnes mentionnés dans le corpus.
Chaque dépêche éditée doit être constituée d'un <front> contenant les métadonnées et d'un <body> contenant la transcription. En cas d'annotation, un élément <back> peut être inséré pour contenir les notes. Toute dépêche doit obligatoirement être identifiée (@xml:id) et numérotée (@n).
@xml:id
L'identifiant aura été inscrit manuellement ou avec un processus supervisé, il est pensé pour être au plus proche de la numérotation du corpus, afin que les URIs soient à la fois courtes et signifiantes.
@n
Le numéro de la dépêche pour affichage. Ce numéro d'ordre est un ajout de notre part, les dépêches étant ainsi classées de manière chronologique. Il permet de distinguer et faire plus rapidement référence aux dépêches. Il est conservé dans un attribut obligatoire, afin d'assurer une désignation courte des items.
L'édition de la correspondance du chancelier Antoine du Bourg est une édition contemporaine, aussi contient-elle toutes les informations attendues. Chaque élément, excepté <index> (indexation thématique), est obligatoire, chacun constituant un point d'accès différent à la dépêche concernée (accès temporel, thématique ou archivistique).
Numéro d'ordre: déjà inséré en attribut dans l'élément <text>
Titre: //front/head.
Date: //front/docDate (date de temps: //docDate/date; date de lieu: //docDate/placeName).
Thèmes abordés à partir d'une liste préallablement établie au sein d'un thésaurus: //front/index.
Analyse: //front/argument.
Tableau de la tradition: //front/div[@type='tradition'].
L'élément index n'est pas obligatoire mais fortement recommandé: il permet une indexation thématique, particulièrement utile pour des corpus constitué de centaines d'items.
L'attribut @corresp permet de relier directement chaque paragraphe du sommaire au paragraphe correspondant dans le texte de la dépêche, permettant ainsi un accès plus facile au texte.
Corps de la dépêche
Le texte d'une dépêche suit une structure diplomatique à la fois simple et flexible: apostrophe, un ou plusieurs paragraphes de texte (corps du texte), formules finales de politesse et courtoisie, mention de la date, signature(s), à quoi il faut ajouter les mentions hors teneur telles que les adresses situées au dos du dernier feuillet. Sans s'attarder sur l'analyse diplomatique de ces formules, il convient de les distinguer pour des raisons d'affichage (distinction de l'apostrophe via un alinéa ou mise en petites capitales des signatures par exemple).
Les abbréviations sont développées sans marqueur particulier. Seules les abbréviations très fréquentes (ex: aud.) ou ne pouvant être résolues ne sont pas développées. Quelle que soit la situation, ces derniers ne font pas l'objet d'un balisage spécifique, l'utilisation de l'élément <abbr> n'est donc pas recommandée ici.
Peut se trouver avant ou après l'élément <closer>. Certains post-scriptum revêtant la même forme que la lettre au sein de laquelle ils sont insérés, il est possible de les encoder à l'aide des mêmes éléments diplomatiques à savoir <opener> et <closer>.
Contient les formules d'ouverture, soit dans les cas des correspondances l'apostrophe ('Sire', 'Monsieur mon cousin') à insérer dans l'élément <salute>.
Contient les formules de fermeture d'une lettre, soit la mention de la date(<dateline>), la formule de courtoisie (<salute>) ainsi que les signatures (<signed>).
Le sens de l'élément <signed> a été restreint par rapport à la TEI pour mieux s'adapter aux spécificités des correspondances. Il désigne les signatures stricto sensu, permettant ainsi la transformation automatique de celles-ci en petites capitales lors de l'affichage.
Contient les mentions hors teneur, marginales ou portées au dos du dernier feuillet soit l'adresse ou diverses mentions ajoutées lors de la réception de la dépêche (nom de l'expéditeur, date de réception, sujet).
Leurs places et types peuvent être renseignés de manière obligatoirement normalisée afin de pouvoir dresser plus facilement des typologies, ces informations peuvent ne pas apparaître au sein de l'édition. La description des mentions hors teneur étant souvent faite en texte libre, celle-ci doit être inséré directement dans un élément @desc.
<notatype="adresse" desc="adresse au dos">A Monsieur, Monsieur le chancelier.</nota>
Description d'une mention hors teneur de manière plus libre qu'au travers des attributs @place et @type.
Indexation et glossaire
Afin d'alléger l'apparat critique, il est préférable de limiter les notes aux simples notes de situation et de constituer à l'aide des notes classiques d'identification des index-glossaires. Chaque nom (à chaque occurence ou à la première occurence de chaque lettre) pouvant alors être immédiatement identifié via l'index-glossaire sans avoir à répéter la note. Cet index se trouve dans l'élément <back> final, commun à tout le corpus et est subdivisé en deux index: noms de personne (<listPerson>) et noms de lieux (<listPlace>).
Chaque élément (<person> ou <place> doit contenir un @xml:id pour pouvoir être appelé à l'occurence correspondante (ex: aupres de mon cousin le <rstype="person" ref="#Montmorency">grant maistre</rs>). A l'inverse, un système de référence depuis l'index à l'occurence peut être mis en place; s'il est beaucoup plus complexe, il peut être mis en place lors de l'encodage ou dans un second temps.
Glossaire
Noms de personnes: <listPerson>
Deux choix peuvent être faits pour les index de noms:
un index simple, reprennant la forme des notes d'identification:
un index structuré, normalisant les noms pour en faire de véritables entrées d'index mais à l'encodage et transformation complexes (l'entrée d'index ne faisant parfois pas au nom de famille mais au titre). Il n'est pas recommandé dans les cas d'index lié intrinsèquement à un corpus, mais uniquement dans ceux de glossaires pouvant donner lieu à bases prosopographiques et constituant donc une entrée presque autonome du texte.
Si le degré de précision est laissé à la discrétion de l'éditeur (l'utilisation de <country> n'est cependant conseillé que pour les villes étrangères), le modèle d'encodage reste le même. L'utilisation de <district> avec une liste de valeur semi-close pour l'attribut @type permet de s'adapter aux différentes unités géographiques nationales.
[CD] Camille Desenclos (École nationale des chartes) noms propres, apparat critique, parties du discours
[JC] Joana Casenave (École nationale des chartes) parties du discours
[RD] Richard Delaplace (Langues'O) tableau de la tradition (témoins, <witness>)
[CH] Clément Hurel (École nationale des chartes) contribution technique
Ce schéma est conçu comme une bibliothèque de composants pour simplifier la définition
d'un projet d'édition d'actes en TEI. Il ne sert à rien seul, il vaut importé par un autre
schéma. Chaque projet doit pouvoir éviter de redéfinir les mêmes éléments, afin qu'une même chose
soit nommée de la même manière (avec les mêmes balises). La tradition de l'édition critique accepte
des variations nombreuses, avec cependant des structures communes qu'il vaut la peine de spécifier
avec précision, cette définition facilitant l'exploitation plus large des corpus par leur normalisation.
Structure générale d'un recueil d'actes
La structure générale d'un recueil d'actes comportera obligatoire un avant-texte avec titre et résumé (<head>, <argument>) afin d'assurer la génération d'un site web. L'élément racine portera en attribut un identifiant de fichier, unique pour l'éditeur.
Une collection d'actes, par exemple un cartulaire, est considéré comme un groupe <group>
de textes <text>. Les actes sont souvent groupés en série linéaire,
il arrive cependant que des éditions (imprimées ou manuscrites)
définissent une organisation hiérarchique de la collection. En ce cas ces sections peuvent
être des groupes titrés <head>, titres conçus pour pouvoir être utilisés dans une table des matières.
Par notice d'acte on entendra le cartouche d'entête établi par l'éditeur.
L'information de ces nombreux champs est
inégalement disponible selon la provenance du texte électronique
(numérisation d'édition imprimée, base de données, édition sur l'original...).
Il est par contre essentiel de choisir les mêmes balises pour la même information, afin de simplifier
le traitement de différentes lots (exemple : rangement par date, table des actes, classement par type…).
On distinguera deux groupes d'informations : ce qui concerne l'acte tel qu'il a eu lieu (analyse diplomatique),
et ce qui concerne les témoins écrits de cet acte (codicologie).
Quant à l'analyse diplomatique, l'attention a d'abord porté sur les consignes d'encodage des dates.
L'indication normalisée d'une langue est généralement portée par la transcription (quand il y en a une).
Un vocabulaire qualifiant la nature d'un acte est en cours d'élaboration sur les cartulaires franciliens.
Pour tout acte, l'indication d'un lieu (avec identifiant INSEE), serait largement
souhaitée, mais l'effort n'est pas encore planifié.
La définition de types d'action juridique est souhaitée, mais pose encore trop de problèmes entre historiens
pour qu'une liste soit imposée.
Le motif nommé front.index définit la structure d'indexation par défaut.
Dans le schéma de corpus (corpus.rng), il faut l'appeler dans la définition du front.
On peut le surcharger dans corpus.rng pour contraindre ou non l'inscription d'éléments d'indexation spécifiques.
Indexation du type d'auteur, obligatoire, valeurs multiples possible. (cf OGJ : "l'accord passé au sujet d'un hommage entre l'abbé de Moissac et le comte de Toulouse est ainsi indexé à acte abbatial, acte princier, car les deux intervenants prennent la parole.")
NB: Dans les tableaux d'OGJ 2a (type d'auteurs) et 2b (type de documents) sont une même catégorie ; le 2b décrivant les documents qui ne sont pas des actes, on se limite pour l'instant qu'au 2a.
Indexation du pays concerné par l'action et non le ressort de l'auteur de l'acte, valeur répétable ; on inscrit le nom contemporain et non historique.
Élément répétable pour les valeurs multiples.
La source des codes utilisée pour représenter les noms de pays est la norme ISO 3166.