La correspondance du chancelier Antoine Du Bourg, schéma de balisage

[CD] Camille Desenclos (École nationale des chartes) : conception et maintenance

Ce schéma spécifie les particularités d'un corpus TEI des éditions électroniques de l'École des chartes (ELEC) : la correspondance du chancelier Antoine du Bourg. Il importe plusieurs autres schémas partagés par d'autres corpus :

acte.rng — Les aspects requis pour tout acte ELEC.
texte.rng — Des modèles de contenus réutilisables pour des corpus autres que des chartes.
teiHeader.rng — Entête fixée de contenu pour tout fichier TEI.

La particularité d'un corpus de correspondances concerne généralement :

Analyse diplomatique — La définition des métadonnées requises dans le cartouche d'entête: dates, titre, sommaire, tableau de la tradition.
Corps de la dépêche — La finesse et le type de balisage de la dépêche (parties du discours diplomatique, paléographie...)
Index — L'index ou glossaire contenant l'identification de noms de lieux ou de personnes mentionnés dans le corpus.

Structure générale d’une dépêche

<text>

Chaque dépêche éditée doit être constituée d'un <front> contenant les métadonnées et d'un <body> contenant la transcription. En cas d'annotation, un élément <back> peut être inséré pour contenir les notes. Toute dépêche doit obligatoirement être identifiée (@xml:id) et numérotée (@n).

@xml:id: L'identifiant aura été inscrit manuellement ou avec un processus supervisé, il est pensé pour être au plus proche de la numérotation du corpus, afin que les URIs soient à la fois courtes et signifiantes.
@n: Le numéro de la dépêche pour affichage. Ce numéro d'ordre est un ajout de notre part, les dépêches étant ainsi classées de manière chronologique. Il permet de distinguer et faire plus rapidement référence aux dépêches. Il est conservé dans un attribut obligatoire, afin d'assurer une désignation courte des items.

Attributs	@xml:id @n
Contenu	front, body,
Usage	group

<body>

Contenu	div type="transcription"
Usage	text

Analyse diplomatique

<front>

L'édition de la correspondance du chancelier Antoine du Bourg est une édition contemporaine, aussi contient-elle toutes les informations attendues. Chaque élément, excepté <index> (indexation thématique), est obligatoire, chacun constituant un point d'accès différent à la dépêche concernée (accès temporel, thématique ou archivistique).

Numéro d'ordre: déjà inséré en attribut dans l'élément <text>
Titre: //front/head.
Date: //front/docDate (date de temps: //docDate/date; date de lieu: //docDate/placeName).
Thèmes abordés à partir d'une liste préallablement établie au sein d'un thésaurus: //front/index.
Analyse: //front/argument.
Tableau de la tradition: //front/div[@type='tradition'].

Contenu	argument, index*,
Usage	text

<index>

L'élément index n'est pas obligatoire mais fortement recommandé: il permet une indexation thématique, particulièrement utile pour des corpus constitué de centaines d'items.

Contenu	term+
Usage	front

<term>

L'attribut @key reprend les valeurs déjà définies dans le thésaurus.

Attributs	@key
Contenu	text()
Usage	index

Sommaire du texte structuré.

Contenu	p+
Usage	front

Attributs	@n? @corresp?
Contenu	text() ,
Usage	argument

@corresp

Valeur	text()

L'attribut @corresp permet de relier directement chaque paragraphe du sommaire au paragraphe correspondant dans le texte de la dépêche, permettant ainsi un accès plus facile au texte.

Corps de la dépêche

Le texte d'une dépêche suit une structure diplomatique à la fois simple et flexible: apostrophe, un ou plusieurs paragraphes de texte (corps du texte), formules finales de politesse et courtoisie, mention de la date, signature(s), à quoi il faut ajouter les mentions hors teneur telles que les adresses situées au dos du dernier feuillet. Sans s'attarder sur l'analyse diplomatique de ces formules, il convient de les distinguer pour des raisons d'affichage (distinction de l'apostrophe via un alinéa ou mise en petites capitales des signatures par exemple).

Les abbréviations sont développées sans marqueur particulier. Seules les abbréviations très fréquentes (ex: aud.) ou ne pouvant être résolues ne sont pas développées. Quelle que soit la situation, ces derniers ne font pas l'objet d'un balisage spécifique, l'utilisation de l'élément <abbr> n'est donc pas recommandée ici.

Texte de la transcription d'une dépêche.

Attributs	@type="transcription"
Contenu	( opener \| postscript \| closer \| nota )*
Usage	body

Peut se trouver avant ou après l'élément <closer>. Certains post-scriptum revêtant la même forme que la lettre au sein de laquelle ils sont insérés, il est possible de les encoder à l'aide des mêmes éléments diplomatiques à savoir <opener> et <closer>.

Attributs	@desc?
Contenu	opener, closer
Usage	div type="transcription"

Contient les formules d'ouverture, soit dans les cas des correspondances l'apostrophe ('Sire', 'Monsieur mon cousin') à insérer dans l'élément <salute>.

Contenu	salute*
Usage	div type="transcription"

Contient les formules de fermeture d'une lettre, soit la mention de la date(<dateline>), la formule de courtoisie (<salute>) ainsi que les signatures (<signed>).

<closer>: <salute>Priant Dieu, Mons<hi rend="sup">r</hi> le Chancellier, qu’il vous ait en sa garde.</salute>

<dateline>Escript à Vallence le dernier jour d’aoust <hi rend="sc">m v<hi rend="sup">c</hi> xxxvi</hi>.</dateline>

<signed>Françoys.</signed>

<signed>Bochetel</signed>
</closer>

L'élément <closer> peut être utilisé plusieurs fois afin de distinguer les mentions autographes.

<closer>: <salute>Et sur ce, je prie Dieu vous donner, Mons<hi rend="sup">r</hi>, ce que plus desirez.</salute>

<dateline>De Nice, le VII<hi rend="sup">e</hi> juing.</dateline>
</closer>

<closer type="autogr">: <salute>Vostre antyerement bon amy </salute>

<signed>Montmorency</signed>
</closer>

Attributs	@type="autogr"?
Contenu	( salute \| dateline \| signed )*
Usage	postscript

Mention finale de la date.

Contenu	( text() )
Usage	closer

Autres exemples dans : closer.

Le sens de l'élément <signed> a été restreint par rapport à la TEI pour mieux s'adapter aux spécificités des correspondances. Il désigne les signatures stricto sensu, permettant ainsi la transformation automatique de celles-ci en petites capitales lors de l'affichage.

Contenu	( text() )
Usage	closer

Autres exemples dans : closer.

Inséré dans <opener>, il sert à encoder l'apostrophe et dans le <closer> les formules de politesse ou de courtoisie.

Contenu	( text() )
Usage	opener closer

Autres exemples dans : closer.

<nota>

Contient les mentions hors teneur, marginales ou portées au dos du dernier feuillet soit l'adresse ou diverses mentions ajoutées lors de la réception de la dépêche (nom de l'expéditeur, date de réception, sujet).

Leurs places et types peuvent être renseignés de manière obligatoirement normalisée afin de pouvoir dresser plus facilement des typologies, ces informations peuvent ne pas apparaître au sein de l'édition. La description des mentions hors teneur étant souvent faite en texte libre, celle-ci doit être inséré directement dans un élément @desc.

<nota type="adresse" desc="adresse au dos">A Monsieur, Monsieur le chancelier.</nota>

Attributs	@place? @type? @desc?
Contenu	( text() )*
Usage	div type="transcription"

@type

Valeur	[ "adresse" \|"reception" \|"note" ]

@desc

Valeur	text()

Description d'une mention hors teneur de manière plus libre qu'au travers des attributs @place et @type.

Indexation et glossaire

Afin d'alléger l'apparat critique, il est préférable de limiter les notes aux simples notes de situation et de constituer à l'aide des notes classiques d'identification des index-glossaires. Chaque nom (à chaque occurence ou à la première occurence de chaque lettre) pouvant alors être immédiatement identifié via l'index-glossaire sans avoir à répéter la note. Cet index se trouve dans l'élément <back> final, commun à tout le corpus et est subdivisé en deux index: noms de personne (<listPerson>) et noms de lieux (<listPlace>).

Chaque élément (<person> ou <place> doit contenir un @xml:id pour pouvoir être appelé à l'occurence correspondante (ex: aupres de mon cousin le <rs type="person" ref="#Montmorency">grant maistre</rs>). A l'inverse, un système de référence depuis l'index à l'occurence peut être mis en place; s'il est beaucoup plus complexe, il peut être mis en place lors de l'encodage ou dans un second temps.

Glossaire

Noms de personnes: <listPerson>

Deux choix peuvent être faits pour les index de noms:

un index simple, reprennant la forme des notes d'identification:

<persName>Guillaume Poyet</persName>

<event>: président au parlement de Paris en 1535, fait chancelier de France le 12 novembre 1538.
</event>

</person>

un index structuré, normalisant les noms pour en faire de véritables entrées d'index mais à l'encodage et transformation complexes (l'entrée d'index ne faisant parfois pas au nom de famille mais au titre). Il n'est pas recommandé dans les cas d'index lié intrinsèquement à un corpus, mais uniquement dans ceux de glossaires pouvant donner lieu à bases prosopographiques et constituant donc une entrée presque autonome du texte.

<persName>: <surname>Poyet</surname>

<forename>Guillaume</forename>
</persName>

<state>: Président au parlement de Paris en 1535

chancelier de France depuis le 12 novembre 1538.
</state>

</person>

Noms de lieux: <listPlace>

Si le degré de précision est laissé à la discrétion de l'éditeur (l'utilisation de <country> n'est cependant conseillé que pour les villes étrangères), le modèle d'encodage reste le même. L'utilisation de <district> avec une liste de valeur semi-close pour l'attribut @type permet de s'adapter aux différentes unités géographiques nationales.

<placeName>Saint-Vallier</placeName>

<location>: <country>France</country>

<district type="departement">Drôme</district>

<district type="arrondissement">Valence</district>

<district type="canton">ch.-l. de cant.</district>
</location>

</place>

Un acte diplomatique en TEI

[OGJ] Olivier Guyotjeannin (École nationale des chartes) direction scientifique
[OC] Olivier Canteaut (École nationale des chartes) direction éditoriale
[VJ] Vincent Jolivet (École nationale des chartes) maintenance
[FG] Frédéric Glorieux (École nationale des chartes)
[CD] Camille Desenclos (École nationale des chartes) noms propres, apparat critique, parties du discours
[JC] Joana Casenave (École nationale des chartes) parties du discours
[RD] Richard Delaplace (Langues'O) tableau de la tradition (témoins, <witness>)
[CH] Clément Hurel (École nationale des chartes) contribution technique

Ce schéma est conçu comme une bibliothèque de composants pour simplifier la définition d'un projet d'édition d'actes en TEI. Il ne sert à rien seul, il vaut importé par un autre schéma. Chaque projet doit pouvoir éviter de redéfinir les mêmes éléments, afin qu'une même chose soit nommée de la même manière (avec les mêmes balises). La tradition de l'édition critique accepte des variations nombreuses, avec cependant des structures communes qu'il vaut la peine de spécifier avec précision, cette définition facilitant l'exploitation plus large des corpus par leur normalisation.

Structure générale d'un recueil d'actes

La structure générale d'un recueil d'actes comportera obligatoire un avant-texte avec titre et résumé (<head>, <argument>) afin d'assurer la génération d'un site web. L'élément racine portera en attribut un identifiant de fichier, unique pour l'éditeur.

<TEI>

Attributs	@xml:id
Contenu	text
Usage	Elément racine

<text>

Contenu	group,
Usage	TEI

<TEI>

<text>

<front>

<head>Cartulaire ...</head>

<argument>: Petit texte pour page d'accueil
</argument>

</front>

<group>

<head>titre court</head>

<group>: <head>Possibilité de sous section</head>

<text>...</text>
</group>

</group>

<back>Index et autres tables</back>

</text>

</TEI>

<group>

Une collection d'actes, par exemple un cartulaire, est considéré comme un groupe <group> de textes <text>. Les actes sont souvent groupés en série linéaire, il arrive cependant que des éditions (imprimées ou manuscrites) définissent une organisation hiérarchique de la collection. En ce cas ces sections peuvent être des groupes titrés <head>, titres conçus pour pouvoir être utilisés dans une table des matières.

Attributs	@type? @n? @xml:id?
Contenu	( text \| group \| )*
Usage	text group

Notice d'acte

Par notice d'acte on entendra le cartouche d'entête établi par l'éditeur. L'information de ces nombreux champs est inégalement disponible selon la provenance du texte électronique (numérisation d'édition imprimée, base de données, édition sur l'original...). Il est par contre essentiel de choisir les mêmes balises pour la même information, afin de simplifier le traitement de différentes lots (exemple : rangement par date, table des actes, classement par type…). On distinguera deux groupes d'informations : ce qui concerne l'acte tel qu'il a eu lieu (analyse diplomatique), et ce qui concerne les témoins écrits de cet acte (codicologie).

Quant à l'analyse diplomatique, l'attention a d'abord porté sur les consignes d'encodage des dates. L'indication normalisée d'une langue est généralement portée par la transcription (quand il y en a une). Un vocabulaire qualifiant la nature d'un acte est en cours d'élaboration sur les cartulaires franciliens. Pour tout acte, l'indication d'un lieu (avec identifiant INSEE), serait largement souhaitée, mais l'effort n'est pas encore planifié. La définition de types d'action juridique est souhaitée, mais pose encore trop de problèmes entre historiens pour qu'une liste soit imposée.

Numéro de l'acte. Peut être sous la forme d'un nombre ou d'un nom de folio. Contient parfois des notes. Peut être répété.

Attributs	@type="num" @n?
Contenu	( text() \| )*
Usage	Élément inutilisé.

Balisage des parties du discours diplomatique

diplomatique

Identification des parties du discours.

Contenu	( seg \| seg function="dispositio" \| seg function="narratio" )+
Usage	quote type="vidime"

<seg>

Attributs	@function
Contenu
Usage	quote type="vidime"

@function

Valeur	"invocation" : invocation, invocation verbale "intitulatio" : suscription "address" : adresse "salutatio" : salut, salutation "notification" : notification personnelle, notification universelle, notification "preamble" : préambule "narratio" : exposé "corroboration" : clause de corroboration -- peut aussi se trouver dans le dispositif "witnessList" : liste de témoins "dating" : formule de date, date "apprecatio" : apprécation "subscriptions" : souscriptions "esn" : mentions hors teneur, mentions de chancellerie

Valeur

"invocation" : invocation, invocation verbale
"intitulatio" : suscription
"address" : adresse
"salutatio" : salut, salutation
"notification" : notification personnelle, notification universelle, notification
"preamble" : préambule
"narratio" : exposé
"corroboration" : clause de corroboration -- peut aussi se trouver dans le dispositif
"witnessList" : liste de témoins
"dating" : formule de date, date
"apprecatio" : apprécation
"subscriptions" : souscriptions
"esn" : mentions hors teneur, mentions de chancellerie

Définitions des éléments du discours diplomatique, Vocabulaire international de Diplomatique (G. Vogeler), pour chaque valeur de @function :

invocation, No. 185
intitulatio, No. 187
address, No. 192
salutatio, No. 194
notification, No. 196b
preamble, No. 196
corroboration, No. 246
witnessList, No. 263
dating, No. 561
apprecatio, No. 251
subscriptions, No. 254
esn, No. 180

Le dispositif (dispositio) et ses sous-parties.

Attributs	@function="dispositio"
Contenu	( seg \| )+
Usage	quote type="vidime"

@function="dispositio"

Valeur	"dispositio" : dispositif

Définitions des éléments du discours diplomatique, Vocabulaire international de Diplomatique (G. Vogeler), pour chaque valeur de @function :

dispositio, No. 198

<seg>

Attributs	@function
Contenu
Usage	seg function="dispositio"

@function

Valeur	"beneficiary" : bénéficiaire "verb" : verbe "corroboration" : corroboration "donatio" : donation? "clauses" : clause

Définitions des éléments du discours diplomatique, Vocabulaire international de Diplomatique (G. Vogeler), pour chaque valeur de @function :

beneficiary, No. 17
verb, pas de terme identifié dans le VID, mentionné pourtant dans la documentation du terme No. 198 (dispositif).
donatio, le terme donation existe en tant que type d'acte (No. 425) mais pas en tant que partie du discours.
clauses, No. 205

L'exposé (narratio) peut contenir un acte vidimé.
Définitions des éléments du discours diplomatique, Vocabulaire international de Diplomatique (G. Vogeler), pour chaque valeur de @function :

narratio, No. 197

Attributs	@function="narratio"
Contenu	( text() \| quote type="vidime"? )+
Usage	quote type="vidime"

Attributs	@type="vidime"
Contenu	diplomatique ( seg \| seg function="dispositio" \| seg function="narratio" )+
Usage	seg function="narratio"

diplo.content

Contenu	( text() \| )+
Usage	seg

Indexation des actes

front.index

Le motif nommé front.index définit la structure d'indexation par défaut.
Dans le schéma de corpus (corpus.rng), il faut l'appeler dans la définition du front.
On peut le surcharger dans corpus.rng pour contraindre ou non l'inscription d'éléments d'indexation spécifiques.

Contenu	index
Usage	Cette définition n'est pas encore utilisée.

<index>

Contenu	term type="auth_type"+, term type="actual_country"*
Usage	Élément inutilisé.

auth_type

Indexation du type d'acte

Contenu	term type="auth_type"
Usage	index

Indexation du type d'auteur, obligatoire, valeurs multiples possible. (cf OGJ : "l'accord passé au sujet d'un hommage entre l'abbé de Moissac et le comte de Toulouse est ainsi indexé à acte abbatial, acte princier, car les deux intervenants prennent la parole.")
NB: Dans les tableaux d'OGJ 2a (type d'auteurs) et 2b (type de documents) sont une même catégorie ; le 2b décrivant les documents qui ne sont pas des actes, on se limite pour l'instant qu'au 2a.

Attributs	@type="auth_type" @key
Contenu	text() ?
Usage	index

@key

Valeur	"act_pontif" : Actes pontificaux "act_episc" : Actes épiscopaux "act_abbat" : Actes abbatiaux "act_eccl" : Actes d'autres ecclésiastique "act_eccl_grac" : Actes d'autre juridiction gracieuse ecclésiastique "act_souv" : Actes de souverains "act_princ" : Actes princiers "act_laic_grac" : Actes de juridiction gracieuse laïque princière et royale "act_admin" : Actes de l'administration locale (royale et princière) "act_seig" : Actes seigneuriaux "act_comm" : Actes communaux, consulaires et échevinaux [sauf juridiction gracieuse] "act_ech_grac" : Actes d'échevinage et de consulat [juridiction gracieuse?] "chma" : Chartes du haut Moyen Âge "not" : Notices "sc_aut" : Actes sous le sceau de l'auteur "sc_loc" : Actes sous le sceau d'une autorité locale "act_notr" : Actes de notaires publics "act_offepisc" : Actes d'officialité épiscopale "" : Valeur libre si aucune des valeurs enregistrées ne convient

Valeur

"act_pontif" : Actes pontificaux
"act_episc" : Actes épiscopaux
"act_abbat" : Actes abbatiaux
"act_eccl" : Actes d'autres ecclésiastique
"act_eccl_grac" : Actes d'autre juridiction gracieuse ecclésiastique
"act_souv" : Actes de souverains
"act_princ" : Actes princiers
"act_laic_grac" : Actes de juridiction gracieuse laïque princière et royale
"act_admin" : Actes de l'administration locale (royale et princière)
"act_seig" : Actes seigneuriaux
"act_comm" : Actes communaux, consulaires et échevinaux [sauf juridiction gracieuse]
"act_ech_grac" : Actes d'échevinage et de consulat [juridiction gracieuse?]
"chma" : Chartes du haut Moyen Âge
"not" : Notices
"sc_aut" : Actes sous le sceau de l'auteur
"sc_loc" : Actes sous le sceau d'une autorité locale
"act_notr" : Actes de notaires publics
"act_offepisc" : Actes d'officialité épiscopale
"" : Valeur libre si aucune des valeurs enregistrées ne convient

Indexation du pays concerné par l'action et non le ressort de l'auteur de l'acte, valeur répétable ; on inscrit le nom contemporain et non historique.
Élément répétable pour les valeurs multiples.
La source des codes utilisée pour représenter les noms de pays est la norme ISO 3166.

Attributs	@type="actual_country" @key
Contenu	text()
Usage	index

@key

Valeur	"BE" : Belgique "CH" : Suisse "CZ" : République Tchèque "DE" : Allemagne "DK" : Danemark "ES" : Espagne "FR" : France "GB" : Grande Bretagne "HR" : Croatie "HU" : Hongrie "IE" : Irlande "IT" : Italie "NL" : Pays-Bas "PT" : Portugal "RO" : Roumanie "SE" : Suède "VA" : Vatican

acte

Contenu
Usage	group

La correspondance du chancelier Antoine Du Bourg, schéma de balisage

Structure générale d’une dépêche

Analyse diplomatique

Corps de la dépêche

Indexation et glossaire

Glossaire

Noms de personnes: <listPerson>

Noms de lieux: <listPlace>

Un acte diplomatique en TEI

Structure générale d'un recueil d'actes

Notice d'acte

Balisage des parties du discours diplomatique

Indexation des actes

Indexation du type d'acte

Balisage général du texte

Schéma de l'entête de métadonnées

Tradition écrite de l'acte (témoins)

Schéma d'encodage des dates