Utilisation de TEI pour coder les documents
historiques
Jean-Daniel Fekete
École des Mines de Nantes
15 novembre 1997
Raisons d'être de TEI
- offrir un format d'échange (basé sur SGML)
- préconiser des conventions de structuration
- promouvoir la description d'éventuelles conventions
spécifiques
- regrouper et factoriser les expériences pluridisciplinaires de codages de documents
- mettre au point des outils pour saisir (coder), travailler et visualiser les documents au format TEI
Application aux textes historiques
- les historiens saisissent leurs documents avec un traitement de texte
- ils adoptent des conventions personnelles ou
traditionnelles
- rarement explicitées ni très formelles pour les premières
- tributaires de contraintes obsolètes pour les deuxièmes
- TEI offre un cadre directement réutilisable pour la plupart des documents
Exemple : transcription de manuscrit
- Traitement de texte (prêt à imprimer)
- HTML (prêt à consulter)
- Codé en TEI Lite
- imprimable selon de multiples configurations
- consultable selon de multiples configurations
- extensible
- référençable
- distribuable
Édition de l'en-tête TEI, vue sans balises
Édition de l'en-tête TEI, vue avec balises
Corps de la lettre, vue sans balises
Corps de la lettre, vue avec balises
En-tête de la lettre au format TEI
<!DOCTYPE TEI.2 PUBLIC "-//TEI//DTD TEI Lite 1.6 //EN" "teilite.dtd">
<TEI.2 LANG=fr>
<TEIHEADER><FILEDESC>
<TITLESTMT><TITLE>Lettre de rémission, format électronique</TITLE>
</TITLESTMT>
<PUBLICATIONSTMT><AUTHORITY>Faculté des Lettres de l'Université
de Nantes</AUTHORITY>
<AVAILABILITY><P>Archives départementales de Nantes</P>
</AVAILABILITY>
<IDNO TYPE="côte">B25</IDNO></PUBLICATIONSTMT>
<SOURCEDESC><P>Regestre des lettres et mandements sellez en la chancelerie de ce pays et duché de Bretagne commencé le mercredy quart jour de janvier l'an mil cinq cens dix neuf</P></SOURCEDESC>
</FILEDESC>
<ENCODINGDESC><PROJECTDESC><P>projet de licence <NAME>Nicole Dufournaud</NAME></P></PROJECTDESC>
<EDITORIALDECL><P>Pratiques éditoriales conformes à <BIBL>l'édition des textes anciens XVIe-XVIIIe siècles, l'inventaire, Documents et méthodes, 1990</BIBL></P></EDITORIALDECL>
</ENCODINGDESC><PROFILEDESC><LANGUSAGE>
<LANGUAGE ID=FR>Français du XVIième siècle</LANGUAGE>
</LANGUSAGE></PROFILEDESC></TEIHEADER>
Outils existants (gratuits)
Conclusion
- Problèmes
- pas encore de conventions pour les manuscrits
- Bénéfices
- un cadre pour capitaliser le codage
- optimisation des ressources humaines
- possibilités de traitements informatiques sur de larges corpus
- évite d'accéder à des documents physiquement fragiles
Références