L’objectif de cette thèse est de constituer une méthodologie de détections des plumes dans le discours présidentiel sous la Vème République. Partant de la génétique des textes - appliquée ici à des textes politiques contemporains - il s’agit d’en dépasser la seule dimension philologique en mettant en œuvre des observables linguistiques et des méthodes de la statistique textuelle.
Plus précisément, le propos est ici de mobiliser et de renouveler des méthodes de statistique lexicale telles que la connexion lexicale ou la distance intertextuelle dans une approche de classification non supervisée des ‘plumes’ croisant différents niveaux de structuration du texte (formes graphiques, formes lemmatisées, étiquettes morphosyntaxiques, etc.) et différents phénomènes de structuration du discours (expressions régulières, cooccurrences, motifs, etc.). Le corpus des discours présidentiels sous la Vème République est déjà constitué, mais un corpus de ‘plumes’ connues devra être composé afin de servir de contre-épreuve à la méthodologie de détection et de permettre son évaluation et son amélioration.