ENC TEI, schéma d'entête <teiHeader>

Ce schéma définit le cartouche d'entête attendu pour tous les fichiers TEI de l'ENC. Il est largement inspiré des préconisations du logiciel Philologic, qui propose une interprétation du teiHeader, testée sur une large variété de corpus.

Modèle d'en-tête

Licence

    Objectifs
  • Promouvoir l'école en contribuant à l'enseignement et à la recherche
  • Éviter qu'un acteur plus fort remporte le crédit du travail et des investissements de l'école
    Références
  • Creative Commons, le texte légal de la licence "Paternité-Pas d'Utilisation Commerciale-Pas de Modification", selon un texte conforme au droit français
  • licence Légifrance, précédent formulé par des juristes considérant des textes du domaine public en XML comme relevant du droit des bases de données.
  • Article L341-1 - Le producteur d'une base de données, entendu comme la personne qui prend l'initiative et le risque des investissements correspondants, bénéficie d'une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d'un investissement financier, matériel ou humain substantiel. Cette protection est indépendante et s'exerce sans préjudice de celles résultant du droit d'auteur ou d'un autre droit sur la base de données ou un de ses éléments constitutifs.
  • Article L342-1 - Le producteur de bases de données a le droit d'interdire :
    1º L'extraction, par transfert permanent ou temporaire de la totalité ou d'une partie qualitativement ou quantitativement substantielle du contenu d'une base de données sur un autre support, par tout moyen et sous toute forme que ce soit ;
    2º La réutilisation, par la mise à la disposition du public de la totalité ou d'une partie qualitativement ou quantitativement substantielle du contenu de la base, quelle qu'en soit la forme.
    Ces droits peuvent être transmis ou cédés ou faire l'objet d'une licence.
  • ABU Licence des bibliophiles universels
  • Licence Morphalou, une attitude intéressantes de la recherche publique, avec la particularité suivante : l'ATILF est propriétaire du TLF (qui est encore sous droits), Morphalou en dérive et peut donc hériter de ces propriétés.
  • Gutemberg Ebooks gratuits, droit américain
Texte de licence validé avec la direction de l'école, à copier/coller depuis les exemples, sans modification.
<dc:rights> (Prévoir ligne courte pour la licence)
restricted
Entête de fichier TEI. Porte des informations documentaire, légales, techniques, pratiques... Un entête articule surtout les blocs suivants : On trouvera ci-dessous un exemple complet permettant de naviguer cette documentation. teiHeader Numéroter et dater une édition si au moins une est prévue dans le futur Ordre de grandeur de la ressources électronique, (mais pas la description physique de la source numérisée) Informations sur la ressource électronique (pas la description de la source numérisé, voir sourceDesc). Les titres répétables sont interprétés hiérarchiquement, 1) titre de corpus, 2) ouvrage dans le corpus, 3) partie d'ouvrage... Les mentions de responsabilité (auteur et/ou éditeur et/ou …) acceptent des formats plus ou moins riches. Nom, Prénom Nom, Prénom
<dc:creator>, prendre author et principal.
Responsable de l'édition électronique. Contributeur à l'édition électronique. Auteur du texte (pour original électronique). Financeur du projet (indiquer une date ?).
Informations sur la collection électronique (pas la description de la source numérisé), avec URI et n° de volume (obligatoire pour l'ENC).
<dc:isPartOf> relation à un parent
URI vol
Personne ayant une responsabilité dans l'élaboration de la ressource électronique, selon le format : Nom, Prénom (affiliation), avec initiales en attribut @xml:id (comme cible de liens, par exemple dans la liste des modifications <change>), et un email optionnel en attribut @ref (privilégier des adresses pérennes 1 an). Ne pas mettre ici l'auteur ou l'éditeur de l'œuvre originale, mais uniquement les personnes responsables de la numérisation.
<dc:contributor>, à voir.
Dates et nature de la responsabilité dans la vie de de la ressource.
Historique des révisions du fichier (destiné à la collaboration entre chercheurs, et à informer l'utilisateur des améliorations apportées entre . Nature de la modification. Identifiant du responsable de la modification. Date de la modification. ([0-9]{4}(-[0-9]{2}(-[0-9]{2})?)?)? Section fixe, sauf la date et l'URI. Date de publication au format ISO /AAAA((-MM)?-JJ)?/, à précisément renseigner, afin que celui qui télécharge le fichier sache la version qu'il a.
<dc:date> ou <dc:issued>, pour la date de publication électronique (uniquement)
URI de référence du fichier, absolument indispensable à renseigner.
<dc:identifier>
Généralement, École nationale des chartes. Permettre de répéter en cas de d'établissement associé. Adresse postale de l'éditeur de la ressource, généralement l'École des chartes. A renseigner si différent du "publisher".
Description de la source numérisée. Le modèle de contenu est pour l'instant limité à la description d'un imprimé (bibl). Il pourra être élargi à la description d'un manuscrit (msDesc). Cet élément (msDesc) mérite une réflexion attentive dans un schéma distinct.
<dc:source>, composer une ligne bibliographique avec les éléments contenus.
Référence bibliographique de l'oeuvre numérisée, en texte mêlé ponctuée, avec typographie légère (italique). Forme courte de la référence bibliographique, par ex. pour l'inscription répétée de la foliotation. i sup sc
Documentation technique de l'encodage. Description scientifique du projet.
<dc:description>
Etendue numérisée de la source. Préciser par exemple les pages qui ne sont pas contenues dans le fichier, et pourquoi. Corrections apportées au document source.
Langue. Intitulé lisible de la langue de la ressource. Code d'identification de la langue, avec extensions simili ISO si nécessaire (exemple : "latin moderne" = la_FR_mod). Prévoir liste d'autorité.
<dc:language>
Proportion approximative de la langue dans la ressource.
Mots clés sujet. Périodisation à établir selon ce que Philologic sait exploiter. period
Adresse éditoriale pour enregistrement bibliographique structuré, notamment dans une entête TEI. Lieu de publication dans une adresse éditoriale complète. Editeur, dans une adresse éditoriale complète. Année de publication de l'ouvrage numérisé /AAAA/,
<dc:created>, à bien distinguer de la date de publication électronique
Date libre qui n'a pas de raison d'être traitée Ligne permettant d'identifier une ressource.
<dc:title> titre de la notice
Paragraphe pour l'entête TEI, sans dépendance, très libéral.