Accueil > Pages Perso > Laurent Vanni

Laurent Vanni

IR -  CNRS

Dernières publicationsHAL

pour l'idHal "lvanni" :

titre
Du texte à l'intertexte. Le palimpseste Macron au révélateur de l'Intelligence artificielle
auteur
Damon Mayaffre, Camille Bouzereau, Magali Guaresi, Frédéric Precioso, Laurent Vanni
article
Congrès mondiale de linguistique française, Jul 2020, Montpellier, France
annee_publi
2020
resume
L'intertexte est la condition de l'interprétation de tout texte. Cependant, sa matérialisation, son explicitation, son implémentation ont toujours paru difficile pour la linguistique textuelle. Cette contribution propose une matérialisation de l'intertexte au sein de corpus réflexifs numériques, et convoque de manière originale l'intelligence artificielle (deep learning, modèle convolutionnel) et la logométrie pour explorer de manière systématique l'intertexte ainsi matérialisé. Pour cette étude, nous postulons que le corpus élyséen depuis 1958 constitue l'intertexte des discours d'Emmanuel Macron, dans lequel le président puise de manière consciente ou inavouée pour construire ses discours. A titre d'exemple, nous mettons ainsi au jour automatiquement les empreintes grammaticales de Giscard dans le discours de Macron, et les emprunts lexicaux que le nouveau président concède à de Gaulle.
typdoc
Communication dans un congrès
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02520224/file/CMLF_Intertexte_Mayafffe_et_al_DEF.pdf BibTex
titre
Ces mots que Macron emprunte à Sarkozy. Discours et intelligence artificielle
auteur
Damon Mayaffre, Magali Guaresi, Laurent Vanni
article
Corpus, Bases, Corpus, Langage - UMR 7320, 2020
annee_publi
2020
resume
La logométrie et l’Intelligence artificielle (deep learning) appliquées aux textes politiques permettent de repérer dans le discours d’Emmanuel Macron les emprunts linguistiques qu’il contracte auprès de ses prédécesseurs à l’Elysée (de Gaulle, Pompidou, Giscard, Mitterrand, Chirac, Sarkozy et Hollande). Les emprunts les plus importants, lexicaux autour de la valeur travail et énonciatifs autour de l’exhibition du « je » et du « je veux », concernent statistiquement Nicolas Sarkozy.
typdoc
Article dans une revue
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02503269/file/corpus-5105.pdf BibTex
titre
Deep learning et authentification des textes
auteur
Étienne Brunet, Laurent Vanni
article
Texto! Textes et cultures, 2019, Texto! Textes et cultures, Volume XXIV, (n°1), pp.1-34
annee_publi
2019
resume
Résumé. Deep Learning et authentification des textes Les problèmes de paternité ou de datation peuvent être abordés avec les moyens habituels de l’histoire littéraire, mais aussi en recourant aux ressources de la statistique et de l’informatique. Diverses mesures intertextuelles ont été proposées pour tenter de distinguer les distances intra (entre les textes d’un même auteur) et les distances inter (entre les auteurs). Malheureusement aucune jusqu’ici n’a pu prétendre au rang de juge suprême, comparable à l’ADN dans les recherches de paternité ou de criminalité. L’Intelligence artificielle peut-elle jouer ce rôle? C’est l’objet de la présente étude, menée conjointement dans deux corpus. Dans le premier, on aborde le roman au XXème siècle en proposant à l’algorithme du Deep Learning un panel de 50 textes et de 25 écrivains (parmi lesquels Roman Gary et Émile Ajar). Il s’agit de reconnaître les textes qui ont le même auteur. Le Deep Learning réussit l’épreuve sans faillir. Fort de cette réussite, le même algorithme est appliqué au théâtre classique. La conclusion est catégorique : Racine, Corneille et Molière se distinguent parfaitement sauf dans deux cas (Don Garcie et Les Plaideurs) où le genre vient brouiller la signature. Le présent article s’interroge sur les mécanismes mis en œuvre dans le Deep Learning. Un développement plus étendu est prévu dans une publication ultérieure.
typdoc
Article dans une revue
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02561039/file/BrunetVanniVersion3.pdf BibTex
titre
Text Deconvolution Saliency (TDS) : a deep tool box for linguistic analysis
auteur
Laurent Vanni, Mélanie Ducoffe, Damon Mayaffre, Frédéric Precioso, Dominique Longrée, Veeresh Elango, Nazly Santos Buitrago, Juan Gonzales Huesca, Luis Galdo, Carlos Aguilar
article
56th Annual Meeting of the Association for Computational Linguistics, Jul 2018, Melbourne, France
annee_publi
2018
resume
In this paper, we propose a new strategy , called Text Deconvolution Saliency (TDS), to visualize linguistic information detected by a CNN for text classification. We extend Deconvolution Networks to text in order to present a new perspective on text analysis to the linguistic community. We empirically demonstrated the efficiency of our Text Decon-volution Saliency on corpora from three different languages: English, French, and Latin. For every tested dataset, our Text Deconvolution Saliency automatically encodes complex linguistic patterns based on co-occurrences and possibly on grammatical and syntax analysis.
typdoc
Communication dans un congrès
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01804310/file/acl2018.pdf BibTex
titre
ADT et deep learning, regards croisés. Phrases-clefs, motifs et nouveaux observables
auteur
Laurent Vanni, Damon Mayaffre, Dominique Longrée
article
JADT 2018, Jun 2018, Rome, Italie
annee_publi
2018
resume
L'extraction de passages-clefs statistiques est d'abord proposée selon plusieurs calculs implémentés dans le logiciel Hyperbase. Uné evaluation de ces calculs en fonction des filtres appliqués (prise en compte des spécificités positives seulement, prise en compte de substantifs seulement, etc) est donnée. L'extraction de passages-clefs obtenus par deep learning-c'est-` a-dire des passages qui ont le meilleur taux de reconnaissance au moment d'une prédiction-est ensuite proposée. L'hypothèse est que le deep learning est bien sûr sensible aux unités linguistes sur lesquelles le calcul des phrases-clefs statistiques se fondent, mais sensiblé egalementàegalement`egalementà d'autres phénomènes que fréquentiels et d'autres observables linguistiques complexes que l'ADT a plus de maì a prendre en compte-comme le seraient des motifs sous-jacents (Mellet et Longrée, 2009). Si cette hypothèse se confirmait, elle permettrait d'une part de mieux appréhender la boˆıteboˆıte noire des algorithmes de deep learning et d'autre part d'offriràoffrir`offrirà la communauté ADT de nouveaux points de vue.
typdoc
Communication dans un congrès
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01823560/file/JADT2018_Vanni_Mayaffre_Longree_DEF.pdf BibTex
titre
Analysing and visualizing textual data with Hyperbase Web Edition
auteur
Laurent Vanni, Dominique Longrée
article
4th Digital Humanities Austria (DHA 2017), Dec 2017, Innsbruck, Austria. 2017
annee_publi
2017
typdoc
Poster
Accès au bibtex
BibTex
titre
Hyperbase Web - Outil d'analyse statistique des données textuelles
auteur
Laurent Vanni
article
ECLAVIT 2017, Nov 2017, Paris, France
annee_publi
2017
typdoc
Poster
Accès au bibtex
BibTex
titre
Les mots des candidats, de « allons » à « vertu »
auteur
Damon Mayaffre, Camille Bouzereau, Mélanie Ducoffe, Magali Guaresi, Frédéric Precioso, Laurent Vanni
article
Pascal Perrineau. Le vote disruptif. Les élections présidentielle et législatives de 2017, Presses SciencesPo, pp.129-152, 2017
annee_publi
2017
typdoc
Chapitre d'ouvrage
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01635941/file/Les%20mots%20des%20candidats.pdf BibTex
titre
As palavras, o texto, os corpora e arquivo: o historiador face à linguística. Logometria e análise do discurso
auteur
Damon Mayaffre, Magali Guaresi, Laurent Vanni, Carlos Maciel
article
Texto Digital, Universidade Federal de Santa Catarina, 2017
annee_publi
2017
typdoc
Article dans une revue
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01673519/file/Mayaffre_et_al_Texto_Digital.pdf BibTex
titre
Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase
auteur
Laurent Vanni, Adiel Mittmann
article
JADT 2016 - Statistical Analysis of Textual Data, Jun 2016, Nice, France. pp.295-305
annee_publi
2016
resume
Finding word cooccurrences and calculating the specificity scores is one of the most popular statistical methods in the analysis of textual data. Within Hyperbase, there is a " theme " feature for this purpose, which is capable of locating words that are used more commonly near a given word form, grammatical structure or lemma. The graphical representation of such an analysis is often challenging ; more than a list of the cooccurring words, it should be able to indicate the order, the score and the relations between pairs of words. Now that Hyperbase has a Web version, this article proposes a new approach for the " theme " feature : the calculation of cooccurrences has been extended to include the second level. The accompanying graphical representation is betting on new visual features in order to simplify reading the results and render the underlying calculation more explicit. Résumé Le calcul des cooccurrents spécifiques d'un mot est une des méthodes statistiques les plus populaires de l'ADT. Le logiciel Hyperbase a introduit cette notion avec la fonction " Th eme " qui rend compte du lexique surutilisé autour d'une forme, d'une structure grammaticale ou d'un lemme. La représentation graphique d'une telle analyse est souvent loin d'ˆ etré evidente. Plus que la simple liste des cooccurrents spécifiques , elle se doit de nous indiquer aussi l'ordre, l'´ ecart ainsi que les relations entre chaque paire de mots. Avec l' arrivée de la version Web d'Hyperbase, nous proposons aujourd'hui une nouvelle approche de cette fonction. Le calcul se voit pour l'occasion approfondi, lui permettant d'identifier la cooccurrence dedeuxì eme niveau. La représentation graphique, quant a elle, fait le pari de simplifier la lecture du résultat de cette analyse tout en explicitant plus précisément les calculs sous-jacents.
typdoc
Communication dans un congrès
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01359413/file/85261.pdf BibTex
  • + de résultats dans la Collection HAL du laboratoire BCL
  • Voir l'ensemble des résultats sur la plateforme HAL