Home > Presentation > Research Teams > Logométrie. Corpus, Traitements, Modèles

Logométrie. Corpus, Traitements, Modèles

Membres permanents :
Brunet, Étienne - Kor Chahine, Irina - Lavigne, Frédéric - Magri, Véronique - Mayaffre, Damon - Poudat, Céline - Ruggia, Simona - Sarbach-Pulicani, Vincent - Vanni, Laurent

 

Membres non-permanents :
Beghini, Federica - Bouzereau, Camille - Chandelier, Marie - Guaresi, Magali - Haris, Sofiane - Kamagate, Karfa - Mellet, Sylvie - Metwally, Heba - Tchemako, Olivia - Longrée, Dominique, Maciel, Carlos - Mahmoudi, Hadi - Maurer, Julia - Mejdoubi, Sara - Rojas, Minerva - Rouveyrol, Laurent - Shinko, Anastasiia - Thon, Valérie

 

Présentation :
De manière automatique ou semi-automatique, grâce à des traitements linguistiques qui ont recours à l’informatique, à la statistique textuelle et au deep learning, l’équipe travaille des corpus textuels : discours politiques contemporains, performances médiatiques, oeuvres littéraires anciennes ou modernes.
S’inscrivant dans l’Analyse du discours, la Linguistique textuelle, la Linguistique de corpus, son principal objectif est de réfléchir sur la discursivité/textualité, de mettre à jour l’organisation interne des textes, de proposer une description contrôlée de leur composition linguistique (vocabulaire récurrent, tonalité grammaticale dominante, structures syntaxiques privilégiées), d’établir des typologies textuelles qui prennent en compte notamment le genre des discours considérés, les conditions d’énonciation, le positionnement socio-historique du locuteur, d’objectiver enfin les parcours de lecture ou parcours interprétatifs.
Pour ce faire, l’équipe manipule des corpus textuels numériques (ce qui implique une réflexion sur la saisie, le stockage, le formatage, la lemmatisation et l’étiquetage des textes) et met au point des méthodes et des outils de traitements automatiques ou semi-automatiques.
S’inscrivant dans la lignée des travaux d’Etienne Brunet, l’équipe privilégie l’approche quantitative, statistique ou mathématique des grands corpus grâce au logiciel de logométrie HYPERBASE, dont on cherche à améliorer les performances et à diversifier les applications notamment dans le champ de la parole politique contemporaine.

 

Axes de recherche :
 Axe 1 : Deep learning, texte et intertextualité
 Axe 2 : Exploration des corpus annotés et ADT
 Axe 3 : Corpus, textométrie, didactique et langues étrangères