Home > Research > Research topics > Corpus, textométrie, didactique et langues étrangères

Corpus, textométrie, didactique et langues étrangères

Cet axe concentre ses efforts sur les relations entre corpus, textométrie, didactique et langues étrangères. Il s’agira de poursuivre les travaux sur l’exploration textométrique des niveaux du CECRL (Cadre Européen Commun de Référence pour les Langues) sur la base de corpus de textes issus de manuels et de méthodes d’une part, et de corpus d’apprenants d’autre part (travaux initiés par S. Ruggia lors du dernier contrat, et déjà engagés en FLE et en russe avec le développement et la mise en ligne des plateformes DeepFLE et Russian Wheel), au moyen notamment du deep learning.
Les annotations des corpus d’apprenants seront utilisées dans une perspective nouvelle : le traitement automatique des textes sera appliqué à des fins de repérage des erreurs et de correction des textes d’apprenants. Les recherches préliminaires ont montré la faisabilité d’un tel projet et nous nous focaliserons sur l’élaboration d’un tel outil.
Enfin, sera également développée la perspective d’une linguistique outillée dont les problématiques et questionnements prennent leur source dans des exigences didactiques, avec un focus sur l’argumentation. Quelles constructions, stratégies discursives, les apprenants de L2 ont-ils besoin de maîtriser pour appréhender l’argumentation dans le cadre de certifications en langues telles que le CLES notamment ? Des corpus authentiques, essentiellement des débats télévisés, sont donc statistiquement analysés en termes de phénomènes pragmatico-énonciatifs et de stratégies argumentatives. Les énoncés jugés saillants et transférables sont extraits pour être ensuite proposés aux apprenants suivant les fonctions discursives identifiées en amont.