Accueil > Recherche > Thématiques > Nouveaux corpus et nouveaux modèles génériques

Nouveaux corpus et nouveaux modèles génériques

Historiquement constituée autour du traitement des corpus littéraires puis politiques, l’équipe entend renforcer sa position leader dans ces domaines notamment par le développement de plateformes web (par ex. Viatitext, Mesure du discours). Néanmoins, elle renouvelle ici ses champs dans deux directions privilégiées :
Corpus Web 2.0 et genres hybrides (resp. C. Poudat).
L’objectif de cet axe est double : il s’agit d’une part d’explorer et de décrire les genres hybrides, notamment du Web 2.0., et d’autre part, de développer des méthodes afin de mettre en œuvre cette exploration. Avec le développement du web 2.0., apparaissent des dispositifs de communication spécifiques, destinés à faciliter les interactions entre les utilisateurs : ces derniers sont invités à collaborer autour d’un objet, à discuter, évaluer et exprimer leur opinion. Ces possibilités s’incarnent dans des genres hybrides, articulant étroitement l’objet et ses représentations, qui se reflètent dans les commentaires, les avis et les discussions qui se tissent autour de lui. Ces nouvelles formes de communication posent de nouveaux enjeux, tant théoriques et conceptuels que méthodologiques : comment les modéliser ? Dans quelle mesure font-ils corpus ? Quelles annotations et quels standards mobiliser ? Comment explorer de tels ensembles de données textuelles au moyen de parcours méthodologiques ADT ad hoc ?
C’est à ces questions que tentera de répondre le présent axe, qui concentrera ses efforts dans un premier temps sur les genres du web et plus particulièrement sur Wikipédia, sur lesquels C. Poudat, assistée de L. Vanni, travaille actuellement. Cette initiative s’inscrit dans une double dynamique nationale, à travers les deux GT Interopérabilité et exploration de corpus, et Corpus multimodaux et nouvelles formes de communication que C. Poudat co-pilote dans le cadre du nouveau consortium national CORLI (Corpus, Langues, Interactions), labellisé par Huma-Num en début d’année 2016 ; et internationale, dans le cadre du groupe d’intérêt spécifique TEI-SIG CMC, qui vise à proposer des recommandations pour adapter les directives de la TEI (Text Encoding Initiative) aux genres de la communication médiée par les réseaux. Cette dimension internationale est également renforcée par le dépôt au printemps 2016 du projet ANR-DFG CroCoWiki (appel FRAL), en partenariat avec l’université et l’IDS (Institut de la langue allemande) de Mannheim, et celui à l’automne 2016 d’un projet de réseau européen COST autour des CMC.
Par ailleurs, sera exploré le genre des brevets d’invention et des documents liés aux brevets (par exemple, les communications entre les avocats et les examinateurs des brevets sur la brevetabilité, documents qui sont publiquement disponibles). L’hybridité de ce genre relève du croisement entre le discours scientifique et le discours juridique, et présente des contrastes importants et révélateurs - concernant le hedging ou l’intertextualité, par exemple - avec les articles purement de recherche, alors même qu’il couvre le même contenu scientifique ou technique. Les méthodes logométriques développées par l’équipe permettront de décrire, de classer et de modéliser les textes de ce genre riche mais peu étudié dont l’enjeu social peut être important. Ce travail sera effectué en partie en collaboration avec des chercheurs du GERAS (Groupe d’Etude et de Recherche en Anglais de Spécialité), où Peter Follette est co-responsable du Groupe de Travail Sciences & Academia.
Textes narratifs, mise en récit et construction mémorielle (resp. P. Follette)
Un axe fédérateur émerge au sein de l’équipe. Il concerne le traitement des textes narratifs et le repérage de la (re)construction mémorielle dans et par le récit. Cet axe s’appuie au départ sur l’Equipex Matrice (2011-2020) dont c’est une des problématiques majeures, et dans lequel plusieurs membres de l’équipe sont impliqués aux côtés de collègues nationaux et internationaux. Il entend aussi développer au sein du laboratoire l’interaction de l’équipe Logométrie avec l’équipe Langage et cognition autour de l’architecture de la mémoire et avec l’équipe Linguistique de l’énonciation autour de la mise en récit de soi. Les corpus d’étude seront variés et concerneront aussi bien la mémoire collective, autrement appelée grand récit, que la mémoire individuelle (ou récit personnel) ; et plus précisément la dialectique entre l’une et l’autre. L’application aux textes littéraires contemporains (J. Giono, A. Ernaux, J. Rouaud), aux textes socio-politiques (témoignages sur la Shoah, sur le 11 septembre 2001 ou le 13 novembre 2015), aux corpus de récits de vie d’oral spontané ou encore aux genres académiques et aux littéracies professionnelles multiplieront les points de vue. De manière plus originale mais heuristique, les aspects narratifs des textes scientifiques seront également explorés ; sera analysée, alors, la construction d’une histoire scientifique ou d’un scénario dans les articles relevant de différentes disciplines scientifiques et de diverses époques afin d’explorer, dans une perspective diachronique, l’évolution de ces aspects jusqu’aux articles modernes. Ce travail permettra aussi d’établir les liens avec le nouveau campus UCA qui se construit à Cannes, sur la narrativité et les techniques de storytelling dans des contextes professionnels différents.