Accueil > Recherche > Thématiques > Corpus et didactique des langues

Corpus et didactique des langues

Responsable : Simona Ruggia
Participants : Irina Kor-Chahine, Simona Ruggia, Laurent Rouveyrol, Laurent Vanni

La didactique des langues étrangères est un champ de recherche très vaste, couvrant toutes les dimensions de l’enseignement et de l’apprentissage, des travaux centrés sur l’évolution du système linguistique des apprenants aux études plutôt ciblées sur l’enseignant, de sa posture linguistique aux matériaux pédagogiques mobilisés.

L’équipe aborde la didactique des langues en l’adossant à l’étude outillée des corpus textuels. Les outils utilisés sont notamment la textométrie et la logométrie, qui viennent soutenir ou guider l’analyse du discours. Un développement récent et particulièrement novateur, caractéristique de l’orientation prise par plusieurs membres de l’équipe, consiste à intégrer également les atouts du deep learning dans la panoplie utilisée pour l’analyse des corpus. 

Quant aux corpus eux-mêmes, ils sont de natures variées selon les objectifs visés par la recherche : corpus de productions d’apprenants, corpus de textes de référence dans la langue cible. La question des niveaux de langue, de leur caractérisation et de leur maîtrise est une question centrale de la didactique des langues et surplombe donc l’analyse automatique des corpus. A ce titre, la prise en compte des descripteurs du Cadre Européen Commun de Référence pour les langues (de A1 à C2) comme paramètre d’analyse est un des axes fort des recherches portées par l’équipe.

L’originalité des travaux menés dans l’équipe tient à la mobilisation des méthodes d’exploration de corpus particulières et innovantes que développe collectivement l’ensemble des membres de l’équipe (approches logométrique, textométrique ADT, deep learning). Il s’agit d’une approche tout à fait singulière et novatrice dans le champ de la didactique des langues.
Deux orientations sont poursuivies : la première tente de décrire le système linguistique des apprenants et d’en étudier les caractéristiques et l’évolution. Les problématiques concernées vont de la description de variétés linguistiques (langues, usages) à différentes dimensions de la didactique des langues afin (i) d’étudier la langue employée par les apprenants (identifier les erreurs mais aussi décrire les règles qui sous-tendent les relations forme/fonction/sens), mais également les caractéristiques discursives et pragmatiques de leurs productions et (ii) décrire l’évolution de la grammaire de l’apprenant par des études longitudinales ou transversales.
La seconde approche s’attache à l’analyse, la description et l’évaluation du niveau des textes dans une langue donnée à partir des descripteurs du Cadre Européen Commun de Référence pour les langues. Il s’agit de construire des corpus qui seront d’une part, analysés pour leurs caractéristiques et qui serviront d’autre part, de corpus d’apprentissage pour le système de deep learning développé par l’équipe (voir axe 1). La TDS (Text Deconvolution Saliency) pourra ensuite être exploitée pour dégager les motifs particuliers des différents niveaux de langue des apprenants. La méthode permet également d’évaluer le niveau de langue d’autres séquences discursives orales ou écrites.