beandeau>

Appel à candidatures

Le laboratoire IHRIM et le consortium ARIANE ont le plaisir de vous inviter à la 5e édition de l'école thématique « Analyser et Publier des corpus encodés en XML » (ÉThAP 2026). Cette année l'école sera consacrée à la préparation, l'analyse et la publication de corpus textuels encodés au format XML avec le logiciel TXM.

La première journée sera consacrée aux concepts et outils de l'analyse textométrique avec TXM et à la création de corpus à partir de données XML.

Elle sera suivie d'une journée dédiée aux technologies XML XPath et XSLT.

La troisième et dernière journée se focalisera sur la personnalisation de corpus à l'aide de transformations XSLT et à leur publication sur un portail TXM Web.

Une formation « Initiation à l'analyse de corpus de textes avec le logiciel ouvert TXM » est par ailleurs prévue le 22 avril 2026 à l'URFIST de Lyon, elle est complémentaire à EThAP 2026 et recommandée aux personnes qui n'ont pas d'expérience en textométrie.

La formation approfondie à la technologie XML XQuery, dans le contexte du logiciel BaseX et du système de publication SynopsX, est prévue pour l'édition 2027.

EThAP s’adresse aux jeunes chercheurs, chercheurs, enseignants-chercheurs et ingénieurs qui souhaitent gagner en autonomie dans le traitement de leurs données encodées en XML et/ou dans l'analyse qualitative et quantitative de données textuelles à l'aide de la plateforme TXM.

Cette école thématique, complémentaire de la formation TEI du CESR à Tours (TEI 1 et TEI 2), de l'école EnExDi à Lyon (enexdi.sciencesconf.org) et de la formation à l'édition numérique de corpus à Strasbourg, est la seule à proposer un travail approfondi avec le langage XSLT et une mise en pratique avec le logiciel TXM.

Il est possible de s’inscrire uniquement à chacune des journées mais les personnes souhaitant suivre l’ensemble de la formation seront prioritaires.

Prérequis : Une connaissance préalable des fondements du langage XML est nécessaire, une familiarité avec les recommandations de la TEI et un minimum de pratique de manipulation de données XML seraient utiles.

Idéalement les participants connaissent déjà TXM et travaillent sur un corpus encodé en XML-TEI (pas forcément dans TXM).

Des extraits de corpus fournis par les participants qui le souhaitent pourront être utilisés comme supports de formation.

La formation est gratuite. Les membres du consortium ARIANE seront prioritaires et leurs frais de séjour à Lyon pourront être pris en charge.

Programme

Lundi 11 mai : Création de Corpus et Analyse avec TXM

  • Concepts et Outils de l'analyse textométrique
  • Aperçu des modules d'import de corpus dans TXM
  • Création de corpus à partir de sources XML-TEI avec le module XTZ

Mardi 12 mai : Technologies XML

  • Généralités XML, XSLT, XPath & XQuery
  • XPath : introduction, application avec Oxygen et utilitaire GetXPathFile sur sources TEI qui seront importées
  • XSLT : introduction, application avec Oxygen et utilitaire ApplyXSLFile sur sources TEI qui seront importées

Mercredi 13 mai : Personnalisation de corpus et publication

  • Personnalisation des éditions TXM avec XSLT
  • Publication de corpus dans un portail TXM
Chargement... Chargement...