École des chartes » ELEC » schema

La correspondance du chancelier Antoine Du Bourg, schéma de balisage

  • [CD] Camille Desenclos (École nationale des chartes) : conception et maintenance

Ce schéma spécifie les particularités d'un corpus TEI des éditions électroniques de l'École des chartes (ELEC) : la correspondance du chancelier Antoine du Bourg. Il importe plusieurs autres schémas partagés par d'autres corpus :

  • acte.rng — Les aspects requis pour tout acte ELEC.
  • texte.rng — Des modèles de contenus réutilisables pour des corpus autres que des chartes.
  • teiHeader.rng — Entête fixée de contenu pour tout fichier TEI.

La particularité d'un corpus de correspondances concerne généralement :

  • Analyse diplomatique — La définition des métadonnées requises dans le cartouche d'entête: dates, titre, sommaire, tableau de la tradition.
  • Corps de la dépêche — La finesse et le type de balisage de la dépêche (parties du discours diplomatique, paléographie...)
  • Index — L'index ou glossaire contenant l'identification de noms de lieux ou de personnes mentionnés dans le corpus.

Structure générale d’une dépêche

<text>

Chaque dépêche éditée doit être constituée d'un <front> contenant les métadonnées et d'un <body> contenant la transcription. En cas d'annotation, un élément <back> peut être inséré pour contenir les notes. Toute dépêche doit obligatoirement être identifiée (@xml:id) et numérotée (@n).

@xml:id
L'identifiant aura été inscrit manuellement ou avec un processus supervisé, il est pensé pour être au plus proche de la numérotation du corpus, afin que les URIs soient à la fois courtes et signifiantes.
@n
Le numéro de la dépêche pour affichage. Ce numéro d'ordre est un ajout de notre part, les dépêches étant ainsi classées de manière chronologique. Il permet de distinguer et faire plus rapidement référence aux dépêches. Il est conservé dans un attribut obligatoire, afin d'assurer une désignation courte des items.
Attributs@xml:id @n
Contenufront, body,
Usage group
<body>
Contenudiv type="transcription"
Usage text

Analyse diplomatique

<front>

L'édition de la correspondance du chancelier Antoine du Bourg est une édition contemporaine, aussi contient-elle toutes les informations attendues. Chaque élément, excepté <index> (indexation thématique), est obligatoire, chacun constituant un point d'accès différent à la dépêche concernée (accès temporel, thématique ou archivistique).

  • Numéro d'ordre: déjà inséré en attribut dans l'élément <text>
  • Titre: //front/head.
  • Date: //front/docDate (date de temps: //docDate/date; date de lieu: //docDate/placeName).
  • Thèmes abordés à partir d'une liste préallablement établie au sein d'un thésaurus: //front/index.
  • Analyse: //front/argument.
  • Tableau de la tradition: //front/div[@type='tradition'].

Contenuargument, index*,
Usage text
<index>
L'élément index n'est pas obligatoire mais fortement recommandé: il permet une indexation thématique, particulièrement utile pour des corpus constitué de centaines d'items.
Contenuterm+
Usage front
<term>
L'attribut @key reprend les valeurs déjà définies dans le thésaurus.
Attributs@key
Contenu text()
Usage index
<argument>
Sommaire du texte structuré.
Contenup+
Usage front
<p>
Attributs@n? @corresp?
Contenu text() ,
Usage argument
@corresp
Valeur text()
L'attribut @corresp permet de relier directement chaque paragraphe du sommaire au paragraphe correspondant dans le texte de la dépêche, permettant ainsi un accès plus facile au texte.

Corps de la dépêche

Le texte d'une dépêche suit une structure diplomatique à la fois simple et flexible: apostrophe, un ou plusieurs paragraphes de texte (corps du texte), formules finales de politesse et courtoisie, mention de la date, signature(s), à quoi il faut ajouter les mentions hors teneur telles que les adresses situées au dos du dernier feuillet. Sans s'attarder sur l'analyse diplomatique de ces formules, il convient de les distinguer pour des raisons d'affichage (distinction de l'apostrophe via un alinéa ou mise en petites capitales des signatures par exemple).

Les abbréviations sont développées sans marqueur particulier. Seules les abbréviations très fréquentes (ex: aud.) ou ne pouvant être résolues ne sont pas développées. Quelle que soit la situation, ces derniers ne font pas l'objet d'un balisage spécifique, l'utilisation de l'élément <abbr> n'est donc pas recommandée ici.

<div type="transcription">
Texte de la transcription d'une dépêche.
Attributs@type="transcription"
Contenu( opener | postscript | closer | nota )*
Usage body
<postscript>
Peut se trouver avant ou après l'élément <closer>. Certains post-scriptum revêtant la même forme que la lettre au sein de laquelle ils sont insérés, il est possible de les encoder à l'aide des mêmes éléments diplomatiques à savoir <opener> et <closer>.
Attributs@desc?
Contenuopener*, closer*
Usage div type="transcription"
<opener>
Contient les formules d'ouverture, soit dans les cas des correspondances l'apostrophe ('Sire', 'Monsieur mon cousin') à insérer dans l'élément <salute>.
Contenusalute*
Usage div type="transcription"
<closer>

Contient les formules de fermeture d'une lettre, soit la mention de la date(<dateline>), la formule de courtoisie (<salute>) ainsi que les signatures (<signed>).

<closer>
<salute>Priant Dieu, Mons<hi rend="sup">r</hi> le Chancellier, qu’il vous ait en sa garde.</salute>
<dateline>Escript à Vallence le dernier jour d’aoust <hi rend="sc">m v<hi rend="sup">c</hi> xxxvi</hi>.</dateline>
<signed>Françoys.</signed>
<signed>Bochetel</signed>
</closer>

L'élément <closer> peut être utilisé plusieurs fois afin de distinguer les mentions autographes.

<closer>
<salute>Et sur ce, je prie Dieu vous donner, Mons<hi rend="sup">r</hi>, ce que plus desirez.</salute>
<dateline>De Nice, le VII<hi rend="sup">e</hi> juing.</dateline>
</closer>
<closer type="autogr">
<salute>Vostre antyerement bon amy </salute>
<signed>Montmorency</signed>
</closer>
Attributs@type="autogr"?
Contenu( salute | dateline | signed )*
Usage postscript
<dateline>
Mention finale de la date.
Contenu( text() )
Usage closer

Autres exemples dans : closer.

<signed>
Le sens de l'élément <signed> a été restreint par rapport à la TEI pour mieux s'adapter aux spécificités des correspondances. Il désigne les signatures stricto sensu, permettant ainsi la transformation automatique de celles-ci en petites capitales lors de l'affichage.
Contenu( text() )
Usage closer

Autres exemples dans : closer.

<salute>
Inséré dans <opener>, il sert à encoder l'apostrophe et dans le <closer> les formules de politesse ou de courtoisie.
Contenu( text() )
Usage opener closer

Autres exemples dans : closer.

<nota>

Contient les mentions hors teneur, marginales ou portées au dos du dernier feuillet soit l'adresse ou diverses mentions ajoutées lors de la réception de la dépêche (nom de l'expéditeur, date de réception, sujet).

Leurs places et types peuvent être renseignés de manière obligatoirement normalisée afin de pouvoir dresser plus facilement des typologies, ces informations peuvent ne pas apparaître au sein de l'édition. La description des mentions hors teneur étant souvent faite en texte libre, celle-ci doit être inséré directement dans un élément @desc.

<nota type="adresse" desc="adresse au dos">A Monsieur, Monsieur le chancelier.</nota>
Attributs@place? @type? @desc?
Contenu( text() )*
Usage div type="transcription"
@type
Valeur"adresse" |"reception" |"note" ]
@desc
Valeur text()
Description d'une mention hors teneur de manière plus libre qu'au travers des attributs @place et @type.

Indexation et glossaire

Afin d'alléger l'apparat critique, il est préférable de limiter les notes aux simples notes de situation et de constituer à l'aide des notes classiques d'identification des index-glossaires. Chaque nom (à chaque occurence ou à la première occurence de chaque lettre) pouvant alors être immédiatement identifié via l'index-glossaire sans avoir à répéter la note. Cet index se trouve dans l'élément <back> final, commun à tout le corpus et est subdivisé en deux index: noms de personne (<listPerson>) et noms de lieux (<listPlace>).

Chaque élément (<person> ou <place> doit contenir un @xml:id pour pouvoir être appelé à l'occurence correspondante (ex: aupres de mon cousin le <rs type="person" ref="#Montmorency">grant maistre</rs>). A l'inverse, un système de référence depuis l'index à l'occurence peut être mis en place; s'il est beaucoup plus complexe, il peut être mis en place lors de l'encodage ou dans un second temps.

Glossaire

Noms de personnes: <listPerson>

Deux choix peuvent être faits pour les index de noms:

  • un index simple, reprennant la forme des notes d'identification:

<person xml:id="Poyet">
<persName>Guillaume Poyet</persName>
<birth>v. 1473</birth>
<death>1548</death>
<event>
<p>président au parlement de Paris en 1535, fait chancelier de France le 12 novembre 1538.</p>
</event>
</person>

  • un index structuré, normalisant les noms pour en faire de véritables entrées d'index mais à l'encodage et transformation complexes (l'entrée d'index ne faisant parfois pas au nom de famille mais au titre). Il n'est pas recommandé dans les cas d'index lié intrinsèquement à un corpus, mais uniquement dans ceux de glossaires pouvant donner lieu à bases prosopographiques et constituant donc une entrée presque autonome du texte.

<person xml:id="Poyet">
<persName>
<surname>Poyet</surname>
<forename>Guillaume</forename>
</persName>
<birth>v. 1473</birth>
<death>1548</death>
<state>
<p>Président au parlement de Paris en 1535</p>
<p>chancelier de France depuis le 12 novembre 1538.</p>
</state>
</person>

Noms de lieux: <listPlace>

Si le degré de précision est laissé à la discrétion de l'éditeur (l'utilisation de <country> n'est cependant conseillé que pour les villes étrangères), le modèle d'encodage reste le même. L'utilisation de <district> avec une liste de valeur semi-close pour l'attribut @type permet de s'adapter aux différentes unités géographiques nationales.

<place xml:id="SVallier">
<placeName>Saint-Vallier</placeName>
<location>
<country>France</country>
<district type="departement">Drôme</district>
<district type="arrondissement">Valence</district>
<district type="canton">ch.-l. de cant.</district>
</location>
</place>

Un acte diplomatique en TEI

  • [OGJ] Olivier Guyotjeannin (École nationale des chartes) direction scientifique
  • [OC] Olivier Canteaut (École nationale des chartes) direction éditoriale
  • [VJ] Vincent Jolivet (École nationale des chartes) maintenance
  • [FG] Frédéric Glorieux (École nationale des chartes)
  • [CD] Camille Desenclos (École nationale des chartes) noms propres, apparat critique, parties du discours
  • [JC] Joana Casenave (École nationale des chartes) parties du discours
  • [RD] Richard Delaplace (Langues'O) tableau de la tradition (témoins, <witness>)
  • [CH] Clément Hurel (École nationale des chartes) contribution technique

Ce schéma est conçu comme une bibliothèque de composants pour simplifier la définition d'un projet d'édition d'actes en TEI. Il ne sert à rien seul, il vaut importé par un autre schéma. Chaque projet doit pouvoir éviter de redéfinir les mêmes éléments, afin qu'une même chose soit nommée de la même manière (avec les mêmes balises). La tradition de l'édition critique accepte des variations nombreuses, avec cependant des structures communes qu'il vaut la peine de spécifier avec précision, cette définition facilitant l'exploitation plus large des corpus par leur normalisation.

Structure générale d'un recueil d'actes

La structure générale d'un recueil d'actes comportera obligatoire un avant-texte avec titre et résumé (<head>, <argument>) afin d'assurer la génération d'un site web. L'élément racine portera en attribut un identifiant de fichier, unique pour l'éditeur.
<TEI>
Attributs@xml:id
Contenutext
UsageElément racine
<text>
Contenugroup,
Usage TEI
<TEI>
<text>
<front>
<head>Cartulaire ...</head>
<argument>
<p>Petit texte pour page d'accueil</p>
</argument>
</front>
<group>
<head>titre court</head>
<text>acte 1</text>
<text>acte 2</text>
<group>
<head>Possibilité de sous section</head>
<text>...</text>
</group>
</group>
<back>Index et autres tables</back>
</text>
</TEI>
<group>

Une collection d'actes, par exemple un cartulaire, est considéré comme un groupe <group> de textes <text>. Les actes sont souvent groupés en série linéaire, il arrive cependant que des éditions (imprimées ou manuscrites) définissent une organisation hiérarchique de la collection. En ce cas ces sections peuvent être des groupes titrés <head>, titres conçus pour pouvoir être utilisés dans une table des matières.

Attributs@type? @n? @xml:id?
Contenu( text | group | )*
Usage text group

Notice d'acte

Par notice d'acte on entendra le cartouche d'entête établi par l'éditeur. L'information de ces nombreux champs est inégalement disponible selon la provenance du texte électronique (numérisation d'édition imprimée, base de données, édition sur l'original...). Il est par contre essentiel de choisir les mêmes balises pour la même information, afin de simplifier le traitement de différentes lots (exemple : rangement par date, table des actes, classement par type…). On distinguera deux groupes d'informations : ce qui concerne l'acte tel qu'il a eu lieu (analyse diplomatique), et ce qui concerne les témoins écrits de cet acte (codicologie).

Quant à l'analyse diplomatique, l'attention a d'abord porté sur les consignes d'encodage des dates. L'indication normalisée d'une langue est généralement portée par la transcription (quand il y en a une). Un vocabulaire qualifiant la nature d'un acte est en cours d'élaboration sur les cartulaires franciliens. Pour tout acte, l'indication d'un lieu (avec identifiant INSEE), serait largement souhaitée, mais l'effort n'est pas encore planifié. La définition de types d'action juridique est souhaitée, mais pose encore trop de problèmes entre historiens pour qu'une liste soit imposée.

<titlePart type="num">
Numéro de l'acte. Peut être sous la forme d'un nombre ou d'un nom de folio. Contient parfois des notes. Peut être répété.
Attributs@type="num" @n?
Contenu( text()  | )*
UsageÉlément inutilisé.

Balisage des parties du discours diplomatique

diplomatique

Identification des parties du discours.

Contenu( seg | seg function="dispositio" | seg function="narratio" )+
Usage quote type="vidime"
<seg>
Attributs@function
Contenu
Usage quote type="vidime"
@function
Valeur
  • "invocation" : invocation, invocation verbale
  • "intitulatio" : suscription
  • "address" : adresse
  • "salutatio" : salut, salutation
  • "notification" : notification personnelle, notification universelle, notification
  • "preamble" : préambule
  • "narratio" : exposé
  • "corroboration" : clause de corroboration -- peut aussi se trouver dans le dispositif
  • "witnessList" : liste de témoins
  • "dating" : formule de date, date
  • "apprecatio" : apprécation
  • "subscriptions" : souscriptions
  • "esn" : mentions hors teneur, mentions de chancellerie

Définitions des éléments du discours diplomatique, Vocabulaire international de Diplomatique (G. Vogeler), pour chaque valeur de @function :

<seg function="dispositio">

Le dispositif (dispositio) et ses sous-parties.

Attributs@function="dispositio"
Contenu( seg | )+
Usage quote type="vidime"
@function="dispositio"
Valeur
  • "dispositio" : dispositif
  • Définitions des éléments du discours diplomatique, Vocabulaire international de Diplomatique (G. Vogeler), pour chaque valeur de @function :

    <seg>
    Attributs@function
    Contenu
    Usage seg function="dispositio"
    @function
    Valeur
    • "beneficiary" : bénéficiaire
    • "verb" : verbe
    • "corroboration" : corroboration
    • "donatio" : donation?
    • "clauses" : clause

    Définitions des éléments du discours diplomatique, Vocabulaire international de Diplomatique (G. Vogeler), pour chaque valeur de @function :

    • beneficiary, No. 17
    • verb, pas de terme identifié dans le VID, mentionné pourtant dans la documentation du terme No. 198 (dispositif).
    • donatio, le terme donation existe en tant que type d'acte (No. 425) mais pas en tant que partie du discours.
    • clauses, No. 205

    <seg function="narratio">

    L'exposé (narratio) peut contenir un acte vidimé.
    Définitions des éléments du discours diplomatique, Vocabulaire international de Diplomatique (G. Vogeler), pour chaque valeur de @function :

    Attributs@function="narratio"
    Contenu( text()  | quote type="vidime"? )+
    Usage quote type="vidime"
    <quote type="vidime">
    Attributs@type="vidime"
    Contenudiplomatique  ( seg | seg function="dispositio" | seg function="narratio" )+
    Usage seg function="narratio"
    diplo.content
    Contenu( text()  | )+
    Usage seg

    Indexation des actes

    front.index

    Le motif nommé front.index définit la structure d'indexation par défaut.
    Dans le schéma de corpus (corpus.rng), il faut l'appeler dans la définition du front.
    On peut le surcharger dans corpus.rng pour contraindre ou non l'inscription d'éléments d'indexation spécifiques.

    Contenuindex
    UsageCette définition n'est pas encore utilisée.
    <index>
    Contenuterm type="auth_type"+, term type="actual_country"*
    UsageÉlément inutilisé.
    auth_type

    Indexation du type d'acte

    Contenuterm type="auth_type"
    Usage index
    <term type="auth_type">

    Indexation du type d'auteur, obligatoire, valeurs multiples possible. (cf OGJ : "l'accord passé au sujet d'un hommage entre l'abbé de Moissac et le comte de Toulouse est ainsi indexé à acte abbatial, acte princier, car les deux intervenants prennent la parole.")
    NB: Dans les tableaux d'OGJ 2a (type d'auteurs) et 2b (type de documents) sont une même catégorie ; le 2b décrivant les documents qui ne sont pas des actes, on se limite pour l'instant qu'au 2a.

    Attributs@type="auth_type" @key
    Contenu text() ?
    Usage index
    @key
    Valeur
    • "act_pontif" : Actes pontificaux
    • "act_episc" : Actes épiscopaux
    • "act_abbat" : Actes abbatiaux
    • "act_eccl" : Actes d'autres ecclésiastique
    • "act_eccl_grac" : Actes d'autre juridiction gracieuse ecclésiastique
    • "act_souv" : Actes de souverains
    • "act_princ" : Actes princiers
    • "act_laic_grac" : Actes de juridiction gracieuse laïque princière et royale
    • "act_admin" : Actes de l'administration locale (royale et princière)
    • "act_seig" : Actes seigneuriaux
    • "act_comm" : Actes communaux, consulaires et échevinaux [sauf juridiction gracieuse]
    • "act_ech_grac" : Actes d'échevinage et de consulat [juridiction gracieuse?]
    • "chma" : Chartes du haut Moyen Âge
    • "not" : Notices
    • "sc_aut" : Actes sous le sceau de l'auteur
    • "sc_loc" : Actes sous le sceau d'une autorité locale
    • "act_notr" : Actes de notaires publics
    • "act_offepisc" : Actes d'officialité épiscopale
    • "" : Valeur libre si aucune des valeurs enregistrées ne convient
    <term type="actual_country">
    Indexation du pays concerné par l'action et non le ressort de l'auteur de l'acte, valeur répétable ; on inscrit le nom contemporain et non historique.
    Élément répétable pour les valeurs multiples.
    La source des codes utilisée pour représenter les noms de pays est la norme ISO 3166.
    Attributs@type="actual_country" @key
    Contenu text()
    Usage index
    @key
    Valeur
    • "BE" : Belgique
    • "CH" : Suisse
    • "CZ" : République Tchèque
    • "DE" : Allemagne
    • "DK" : Danemark
    • "ES" : Espagne
    • "FR" : France
    • "GB" : Grande Bretagne
    • "HR" : Croatie
    • "HU" : Hongrie
    • "IE" : Irlande
    • "IT" : Italie
    • "NL" : Pays-Bas
    • "PT" : Portugal
    • "RO" : Roumanie
    • "SE" : Suède
    • "VA" : Vatican
    acte
    Contenu
    Usage group

    Balisage général du texte

    Schéma de l'entête de métadonnées

    Tradition écrite de l'acte (témoins)

    Schéma d'encodage des dates