Vient de paraître

Corpus 20 – 2020

sous la direction de Céline Poudat, Ciara R. Wigham et Loïc Liégeois

Assemblée générale et galette des rois

Jeudi 23 janvier 2020 à 14h (SJA1, salle 402)

Workshop Series in Cognitive Science (Grands Colloques de l’Académie 5)

Speech variation: Impact on perception and comprehension

17–18 janvier 2020, MSH, Nice

All news

News & Agenda

Corpus 20 – 2020
Vient de paraître

Corpus 20 – 2020

sous la direction de Céline Poudat, Ciara R. Wigham et Loïc Liégeois

Corpus 20 – 2020
Corpus complexes
Traitements, standardisation et analyse des corpus de communication médiée par les réseaux sociaux (...)

View online : Texte intégral

Assemblée générale et galette des rois

Assemblée générale et galette des rois

Jeudi 23 janvier 2020 à 14h (SJA1, salle 402)

L’assemblée générale du laboratoire BCL se tiendra jeudi 23 janvier 2020 à 14h. Elle sera suivie de la galette traditionnelle vers 16h.

Speech variation: Impact on perception and comprehension
Workshop Series in Cognitive Science (Grands Colloques de l’Académie 5)

Speech variation: Impact on perception and comprehension

17–18 janvier 2020, MSH, Nice

Friday 17th
9h00 Intro
9h10-10h00 Arthur Samuel and Yi Zheng (...)

La définition dans l'Antiquité
Journée d’étude

La définition dans l’Antiquité

Jeudi 21 novembre 2019, SJA3, « Salle Plate »

Programme de la journée
9h00–9h30
Accueil et ouverture de la journée d’étude (...)

Approche psycholinguistique des figures de construction
Journée d’étude

Approche psycholinguistique des figures de construction

22 novembre 2019, Salle des Actes, Sorbonne, Paris

Journée d’étude organisée avec le concours de l’équipe d’accueil Sens Texte Informatique Histoire, l’UMR 7320 Bases Corpus Langage et Sorbonne Université
Organisation : Marie-Albane Watine et Antoine (...)

Tolerance(s) — concepts, language, ideas, history
Colloque

Tolerance(s) — concepts, language, ideas, history

12–13 octobre 2020, Royal Swedish Academy of Letters, History, and Antiquities, Stockholm University, Suède

It will be multi-disciplinary but mainly focusing on the two following themes: what could the concept "tolerance" mean today (from, for example, a linguistic, literary, historical or sociological (...)

Playing with nonwords: Morphological skills in developmental dyslexia
Cycle BCL - Chiara Melloni

Playing with nonwords: Morphological skills in developmental dyslexia

14 novembre 2019 - Salle Plate

While phonological and morphological abilities are both crucial for the acquisition of reading, morphology has been found to play a pivotal role especially at later stages of literacy (...)

Nouvelle règlementation missions

Nouvelle règlementation missions

A conserver: vos justificatifs pour les repas

Suite à la nouvelle règlementation sur les missions, le CNRS demande à présent de fournir un justificatif pour chaque repas pris en mission. Cela peut être une facture de restaurant, ou bien le ticket (...)

Journée des Doctorant·e·s et Assemblée générale

Journée des Doctorant·e·s et Assemblée générale

11 juillet 2019, Salle Plate

La Journée des Doctorant·e·s aura lieu jeudi 11 juillet 2019, de 9h30 à 12h15 : nous aurons le plaisir d’entendre les doctorant·e·s du laboratoire nous présenter leurs recherches.
Cette journée sera (...)

View online : Participation au buffet (Doodle)

Caractéristiques syntaxiques et sémantiques de la subordonnée interrogative en anglais contemporain
Axe inter-équipes « Des processus interrogatifs » – Laëtitia Léonarduzzi

Caractéristiques syntaxiques et sémantiques de la subordonnée interrogative en anglais contemporain

Jeudi 4 juillet, 10h–12h, Bâtiment de l’Horloge, Salle 213

Caractéristiques syntaxiques et sémantiques de la subordonnée interrogative en anglais contemporain
Laëtitia Léonarduzzi (Aix-Marseille Université,UMR 7309 Parole et Langage)
Les interrogatives (...)

Latest publicationsHAL

titre
Cavalcanti, Bartolomeo
auteur
Véronique Montagne
article
Encyclopedia of Renaissance Philosophy, Springer International Publishing, pp.1-2, 2020, ⟨10.1007/978-3-319-02848-4_721-2⟩
annee_publi
2020
typdoc
Book sections
Accès au bibtex
BibTex
titre
Irony, Renaissance Idea of
auteur
Véronique Montagne
article
Encyclopedia of Renaissance Philosophy, Springer International Publishing, pp.1-2, 2020, ⟨10.1007/978-3-319-02848-4_1143-2⟩
annee_publi
2020
typdoc
Book sections
Accès au bibtex
BibTex
titre
Enseigner à évaluer le niveau de langue d’une production orale grâce à l’intelligence artificielle.
auteur
Simona Ruggia
article
XVe Congrès Mondial de la FIPF Le français, langue de partage, Féderation Internationale des Professeurs de Français, Jul 2020, Yasmine Hammamet, Tunisie
annee_publi
2020
typdoc
Conference papers
Accès au bibtex
BibTex
titre
Du texte à l'intertexte. Le palimpseste Macron au révélateur de l'Intelligence artificielle
auteur
Damon Mayaffre, Camille Bouzereau, Magali Guaresi, Frédéric Precioso, Laurent Vanni
article
Congrès mondiale de linguistique française, Jul 2020, Montpellier, France
annee_publi
2020
resume
L'intertexte est la condition de l'interprétation de tout texte. Cependant, sa matérialisation, son explicitation, son implémentation ont toujours paru difficile pour la linguistique textuelle. Cette contribution propose une matérialisation de l'intertexte au sein de corpus réflexifs numériques, et convoque de manière originale l'intelligence artificielle (deep learning, modèle convolutionnel) et la logométrie pour explorer de manière systématique l'intertexte ainsi matérialisé. Pour cette étude, nous postulons que le corpus élyséen depuis 1958 constitue l'intertexte des discours d'Emmanuel Macron, dans lequel le président puise de manière consciente ou inavouée pour construire ses discours. A titre d'exemple, nous mettons ainsi au jour automatiquement les empreintes grammaticales de Giscard dans le discours de Macron, et les emprunts lexicaux que le nouveau président concède à de Gaulle.
typdoc
Conference papers
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02520224/file/CMLF_Intertexte_Mayafffe_et_al_DEF.pdf BibTex
titre
Caractériser un texte en français : les passages-clés des niveaux A1 et A2 du CECRL.
auteur
Simona Ruggia
article
JADT 2020 15èmes Journées internationales d’Analyse statistique des Données Textuelles, Jun 2020, Toulouse, France
annee_publi
2020
resume
La question des niveaux de langue tels que définis par le Cadre Européen Commun de Référence pour les Langues (CECRL) (Conseil de l’Europe, 2001), de leur caractérisation et de leur maîtrise est une question centrale de la didactique du français langue étrangère (FLE) et surplombe l'analyse automatique des corpus. Notre recherche s’est appuyée sur un corpus échantillonné qui comporte six classes de niveaux de langue : à savoir A1, A2, B1, B2, C1 et C2. Ce corpus, dont l’étendue est de 595.980 occurrences, est constitué de nombreux textes oraux extraits de plusieurs ensembles pédagogiques de français langue étrangère (FLE). Notre contribution présentera d’une part, l’extraction statistique des saillances qui marquent un changement de niveau selon le CECRL grâce à Hyperdeep, qui exploite un modèle de deep learning (Vanni et al., 2020) capable d’extraire les caractéristiques qui donnent une empreinte unique du texte, et d’autre part, les passages-clés qui caractérisent les textes de niveaux A1 et A2 grâce à l’analyse des données textuelles (ADT) et plus précisément à la plateforme Hyperbase web.
typdoc
Conference papers
Accès au bibtex
BibTex
titre
Objectiver l'intertexte ? Emmanuel Macron, deep learning et statistique textuelle
auteur
Damon Mayaffre, Laurent Vanni
article
JADT 2020, Jun 2020, Toulouse, France
annee_publi
2020
resume
Cette contribution propose un parcours méthodologique susceptible d’objectiver l’intertexte ; l’intertexte politique des discours du président français Emmanuel Macron en l’occurrence. Le deep learning (modèle convolutionnel) est d’abord utilisé pour « apprendre » (taux d’accuracy satisfaisant de 92,3%) le discours présidentiel français depuis 1958 : les discours de de Gaulle, Pompidou, Giscard, Mitterrand, Chirac, Sarkozy et Hollande sont alors considérés comme l’intertexte potentiel des discours de Macron. Ensuite, les textes de Macron – inconnus jusqu’ici du système – sont versés dans le modèle et nous forçons la machine à attribuer les passages de Macron à l’un de ses prédécesseurs en fonction de leur composition linguistique. Enfin, l’algorithme extrait et décrit les passages et les unités linguistiques (wTDS, spécificités lexicales, cooccurrences, étiquettes morpho-syntaxiques) de Macron interprétées par la machine comme ressemblant à celles de de Gaulle ou Sarkozy, à celles de Mitterrand ou de Hollande. Le discours de Macron est traversé, de manière explicite parfois, de manière implicite le plus souvent, par les discours de ses prédécesseurs – phénomène que l’on appellera « intertextualité » – et l’Intelligence artificielle et la statistique textuelle peuvent repérer les phénomènes d’emprunt, d’imitation voire de plagiat.
typdoc
Conference papers
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02894990/file/Mayaffre_Vanni_jadt2020_Intertexte_DEF.pdf BibTex
titre
Hyperdeep : deep learning descriptif pour l'analyse de données textuelles
auteur
Laurent Vanni, Marco Corneli, Dominique Longrée, Damon Mayaffre, Frédéric Precioso
article
JADT 2020, Jun 2020, Toulouse, France
annee_publi
2020
resume
Depuis peu, les outils d'aide à l'interprétation des résultats du deep learning font leur apparition (LIME, LSTMVIS, TDS). Dans cette communication nous proposons d'aller plus loin en allant chercher l'information cachée au plus profond des couches intermédiaires du deep learning grâce à un nouvel outil. Hyperdeep permet d'une part de prédire l’appartenance d’un texte et d’en apprécier les emprunts à différents styles ou auteurs et d’autre part, par déconvolution, d'analyser les saillances du texte afin d’en faire remonter les marqueurs linguistiques appris par le réseau. Cette information d’un genre nouveau est rassemblée et mise en valeur dans un nouvel outil mêlant visualisations graphiques et texte dynamique. Son utilisation est accompagnée d’une intégration complète dans la plateforme Hyperbase Web qui propose l’environnement adéquate et un point de départ naturel pour toute étude mêlant deep learning et statistiques du texte.
typdoc
Conference papers
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02926880/file/jadt2020.pdf BibTex
titre
Le deep learning comme défi pour identifier le style d'un écrivain : l'exemple de Jean Giono
auteur
Véronique Magri
article
JADT, Jun 2020, Toulouse, France
annee_publi
2020
resume
Et si l'intelligence artificielle parvenait à identifier le style d'un écrivain ? Et si, de manière automatique, la machine parvenait à identifier les caractéristiques d'une écriture, autrement dit les éléments formels reconnaissables d'une oeuvre à l'autre, de même que les différences d'un corpus d'étude par rapport à un corpus de référence ? Si finalement une écriture pouvait être décryptée par un algorithme ? C'est précisément le défi que lance le deep learning appliqué à la littérature. C'est exactement l'expérimentation qui est tentée sur Giono, à partir d'une base de textes numériques inédite, un très grand corpus qui rassemble les oeuvres romanesques de Giono. La mesure différentielle nécessaire guide la constitution des corpus ; deux bases ont ainsi été constituées par É. Brunet : l'une réunit les oeuvres de Giono, traitées par le logiciel Hyperbase. L'autre est un vaste corpus de référence dont l'homogénéité générique et temporelle est garantie puisqu'il s'agit de 50 romans du XX e au XXI e siècles. Le corpus a été constitué par É. Brunet et comporte deux textes du même auteur soit 50 textes pour 25 auteurs. De la prédiction à la déconvolution se construit un parcours interprétatif tendu vers l'horizon de la découverte d'un style d'auteur.
typdoc
Conference papers
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02936437/file/MagriV_jadt2020_relu.pdf BibTex
titre
Velar softening is phonological: EEG-based evidence
auteur
Tobias Scheer, Mirjam de Jonge, Alexander Chabot
article
Generative Linguistics of the Old World (GLOW 43), Apr 2020, Berlin, Germany
annee_publi
2020
typdoc
Conference papers
Accès au bibtex
BibTex
titre
Du discours à la grammaire : quelques remarques à propos de genres, types et modes
auteur
Laurent Rouveyrol
article
Journée d'études Articulation grammaire / modes de discours / genres, Apr 2020, Paris, France
annee_publi
2020
typdoc
Conference papers
Accès au bibtex
BibTex
  • + de résultats dans la Collection HAL du laboratoire BCL