De nombreux textes historiques et littéraires sont riches en noms propres et descriptions définies désignant des personnes, lieux et organisations. Ces segments de textes sont désignés sous le nom d’entité nommée dans le domaine du traitement automatique des langues (TAL). Cette présentation s’intéressera à l’étiquetage et l’identification manuelle et automatique des entités nommées. Il sera question des outils TAL qui vont aider à automatiser ces tâches pour l’indexation des textes en humanités numériques dans le cadre d’une collaboration avec les laboratoires LATTICE (UMR 8094) et PRAXILING (UMR 5267) et l'Université de Carthage.
Dans cette deuxième partie de la formation, il sera question d'améliorer la qualité des résultats obtenus en jouant sur le corpus d'entraînement et aussi les dictionnaires.
L'atelier se déroulera de 14h et 18h en salle D224 à la Maison de la Recherche, 28 rue Serpente, 75006 Paris.
Une pause café est prévue à 15h30.
No comments:
Post a Comment