Sunday, March 29, 2020

Atelier TEXTES / humanités numériques - EHESS, C. Roland Mousnier, OBVIL

Chères et chers collègues,

Nous vous annonçons la mise en place des ateliers TEXTES, il s'agit d'un lieu de rencontre pour échanger autour des questions scientifiques et méthodologiques liées à des travaux de recherche en sciences humaines et sociales qui mobilisent des données textuelles et des méthodes issues du traitement automatique de langues, de la textométrie, de l'analyse textuelle, ... 

Ces ateliers sont organisés conjointement par le Centre Roland Mousnier, le Labex OBVIL, et l'EHESS

Cette année, nous vous proposons trois séances : 
- le 2 mars, 14h-18h
- le 5 mai, 14h-18h 
- le 8 juin, 14h-18h
 
Chaque séance comprend la réalisation d'un exercice guidé, la présentation d'un outil ou d'une méthodologie contextualisée avec un usage en SHS, puis nous finiront par un échange avec l'ensemble des participants sur leurs besoins liés à leurs projets de recherche. Enfin, nous essayerons de vous orienter sur des pratiques et des solutions adaptés à vos besoins..

La première séance du 2 mars s'intéresse particulièrement à l'acquisition de données textuelles à partir de sources diverses, il peut s'agir de la transcription manuelle ou semi-automatique (HTR/OCR) ou bien de la récupération de données par scrapping/crawling de sites Web, etc. On portera une attention particulière à la structuration (en XML-TEI) et au nettoyage de ces textes en vue de la création d'une base de données et pour les intégrer dans un outil d'analyse textométrique comme TXM.

Elle aura lieu à l'EHESS, au 54 boulevard Raspail, 75006 Paris, en salle A516, 5e étage

Si vous souhaitez y participer, vous pouvez vous inscrire par retour de mail.

Bien à vous,
Motasem Alharabi (OBVIL), Benoit Pandolfi (CRM), Carmen Brando (EHESS)