Appel à contributions

Colloque international « Linguistique de la définition : formes, textes, discours »

27–28 mai 2021 MSHS Sud-Est

Vient de paraître

Corpus 20 – 2020

sous la direction de Céline Poudat, Ciara R. Wigham et Loïc Liégeois

Workshop Series in Cognitive Science (Grands Colloques de l’Académie 5)

Speech variation: Impact on perception and comprehension

17–18 janvier 2020, MSH, Nice

Toutes les actualités

News & Agenda

A Semantics of attitude reports based on a novel ontology of attitudinal objects, conférence de Friederike Moltmann
Cycle BCL

A Semantics of attitude reports based on a novel ontology of attitudinal objects, conférence de Friederike Moltmann

Jeudi 25 mars, 14h, SJA, Salle 213 (et à distance)

A Semantics of attitude reports based on a novel ontology of attitudinal objects
Friederike Moltmann
(directrice de recherche au CNRS, actuellement chercheuse invitée à l’Université Ca’Foscari de (...)

Online ansehen : Lien pour la réunion Zoom

Actualités de Louis Meigret, humaniste et linguiste
Parution

Actualités de Louis Meigret, humaniste et linguiste

Sous la direction de Véronique Montagne et Cendrine Pagani-Naudet

Actualités de Louis Meigret, humaniste et linguiste
Sous la direction de Véronique Montagne et Cendrine Pagani-Naudet
En 1980, Franz Josef Hausmann a contribué à rendre accessible l’œuvre de Louis (...)

Assemblée générale

Assemblée générale

Jeudi 21 janvier 2021 à 14h (en visioconférence)

L’assemblée générale du laboratoire BCL se tiendra jeudi 21 janvier 2021 à 14h. Le lien pour la visioconférence sera communiqué ultérieurement.

Colloque international « Linguistique de la définition : formes, textes, discours »
Appel à contributions

Colloque international « Linguistique de la définition : formes, textes, discours »

27–28 mai 2021 MSHS Sud-Est

Dans la lignée des deux journées d’étude qui se sont déroulées à Nice en octobre 2015 et en décembre 2019, l’équipe “Linguistique de l’énonciation” du laboratoire « Bases, Corpus, Langage » organise un (...)

Corpus 20 – 2020
Vient de paraître

Corpus 20 – 2020

sous la direction de Céline Poudat, Ciara R. Wigham et Loïc Liégeois

Corpus 20 – 2020
Corpus complexes
Traitements, standardisation et analyse des corpus de communication médiée par les réseaux sociaux (...)

Online ansehen : Texte intégral

Speech variation: Impact on perception and comprehension
Workshop Series in Cognitive Science (Grands Colloques de l’Académie 5)

Speech variation: Impact on perception and comprehension

17–18 janvier 2020, MSH, Nice

Friday 17th
9h00 Intro
9h10-10h00 Arthur Samuel and Yi Zheng (...)

La définition dans l'Antiquité
Journée d’étude

La définition dans l’Antiquité

Jeudi 21 novembre 2019, SJA3, « Salle Plate »

Programme de la journée
9h00–9h30
Accueil et ouverture de la journée d’étude (...)

Approche psycholinguistique des figures de construction
Journée d’étude

Approche psycholinguistique des figures de construction

22 novembre 2019, Salle des Actes, Sorbonne, Paris

Journée d’étude organisée avec le concours de l’équipe d’accueil Sens Texte Informatique Histoire, l’UMR 7320 Bases Corpus Langage et Sorbonne Université
Organisation : Marie-Albane Watine et Antoine (...)

Tolerance(s) — concepts, language, ideas, history
Colloque

Tolerance(s) — concepts, language, ideas, history

12–13 octobre 2020, Royal Swedish Academy of Letters, History, and Antiquities, Stockholm University, Suède

It will be multi-disciplinary but mainly focusing on the two following themes: what could the concept "tolerance" mean today (from, for example, a linguistic, literary, historical or sociological (...)

Playing with nonwords: Morphological skills in developmental dyslexia
Cycle BCL - Chiara Melloni

Playing with nonwords: Morphological skills in developmental dyslexia

14 novembre 2019 - Salle Plate

While phonological and morphological abilities are both crucial for the acquisition of reading, morphology has been found to play a pivotal role especially at later stages of literacy (...)

Dernières publicationsHAL

titre
Hold-out strategy for selecting learning models: application to categorization subjected to presentation orders
auteur
Giulia Mezzadri, Thomas Laloë, Fabien Mathy, Patricia Reynaud-Bouret
article
2021
annee_publi
2021
resume
In this article, we develop a new general inference method for selecting learning models. The method relies upon a specific hold-out cross-validation, which takes into account the dependency within the data. This allows us to retrieve the model that best fits the learning strategy of a single individual. The novelty of our approach lies on the choice of the testing set, both in the experimental design and in the data analysis. This individual approach is then applied to two category learning models (ALCOVE and Component-cue) on data-sets manipulating presentation order, after verification of the reliability of our method. We found that both models performed equally well during transfer, but Componentcue best fits the majority of participants during learning. To further analyze these models, we also investigated a potential relation between the underlying mechanisms of the models and the actual types of presentation order assigned to participants.
typdoc
Preprints, Working Papers, ...
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03284595/file/paper2_MLMR.pdf BibTex
titre
Enseigner à évaluer le niveau de langue d’une production orale grâce à l’intelligence artificielle.
auteur
Simona Ruggia
article
XVe Congrès Mondial de la FIPF Le français, langue de partage, Féderation Internationale des Professeurs de Français, Jul 2021, Yasmine Hammamet, Tunisie
annee_publi
2021
typdoc
Conference papers
Accès au bibtex
BibTex
titre
L’exclamation en grec ancien
auteur
Michèle Biraud, Camille Denizot, Richard Faure
article
Peeters, 2021, L’exclamation en grec ancien, 978-90-429-4635-4
annee_publi
2021
resume
Cet ouvrage est la première étude d’ensemble de l’exclamation en grec ancien. À partir d’un relevé très précis dans un corpus dialogué (théâtral et philosophique), il passe au crible une série d’énoncés expressifs en prenant en compte de multiples facteurs (interjections, particules, syntaxe elliptique ou atypique, cohésion textuelle) pour ciseler les contours d’un phénomène trop souvent élargi à tout énoncé expressif, en se fondant sur des critères unifiés : l’évidence d’un contenu s’impose au locuteur qui en même temps s’en distancie par l’acte d’exclamation. Focalisation et haut degré y jouent un rôle primordial. Des structures jusqu’à présent non-identifiées sont mises en évidence. Cette étude intéressera autant les linguistes généralistes que les hellénistes. Les concepts de linguistique générale mettent en lumière certains phénomènes du grec. Ils sont en retour mis à l’épreuve des données de cette langue et réévalués.
typdoc
Books
Accès au bibtex
BibTex
titre
Benefits and pitfalls of data compression in visual working memory
auteur
Laura Lazartigues, Frédéric Lavigne, Carlos Aguilar, Nelson Cowan, Fabien Mathy
article
Attention, Perception, and Psychophysics, Springer Verlag, 2021, ⟨10.3758/s13414-021-02333-x⟩
annee_publi
2021
resume
Data compression in memory is a cognitive process allowing participants to cope with complexity to reduce information load. However, previous studies have not yet considered the hypothesis that this process could also lead to over-simplifying information due to haphazard amplification of the compression process itself. For instance, we could expect that the over-regularized features of a visual scene could produce false recognition of patterns, not because of storage capacity limits but because of an errant compression process. To prompt memory compression in our participants, we used multielement visual displays for which the underlying information varied in compressibility. The compressibility of our material could vary depending on the number of common features between the multi-dimensional objects in the displays. We measured both accuracy and response times by probing memory representations with probes that we hypothesized could modify the participants’ representations. We confirm that more compressible information facilitates performance, but a more novel finding is that compression can produce both typical memory errors and lengthened response times. Our findings provide clearer evidence of the forms of compression that participants carry out.
typdoc
Journal articles
Accès au bibtex
BibTex
titre
Chapter 9. Identification of clusters of lexical areas using geographical factors
auteur
Clément Chagnaud, Guylaine Brun-Trigaud, Philippe Garat
article
Hans Van de Velde; Nanna Haug Hilton; Remco Knooihuizen. Language Variation – European Perspectives VIII Selected papers from the Tenth International Conference on Language Variation in Europe (ICLaVE 10), Leeuwarden, June 2019, John Benjamins B.V., pp.210-225, 2021, 978 90 272 5982 0. ⟨10.1075/silv.25.09cha⟩
annee_publi
2021
resume
We propose a multidimensional statistical analysis procedure using projection and clustering methods in order to identify coherent clusters in a set of lexical areas. The methodology includes a geographical factor, such as administrative divisions or land cover features, to help the identification of clusters. By applying this method on data from the Occitan language area in the south of France, we are able to identify new spatial patterns and lexical boundaries that do not match traditional dialect boundaries. Our method helps to suggest possible explanations for these new patterns.
typdoc
Book sections
Accès au bibtex
BibTex
titre
Définir, énumérer et diviser : l'exemple des anatomies de la Renaissance
auteur
Véronique Montagne
article
Réforme, Humanisme, Renaissance, Association d'Études sur la Renaissance, l'Humanisme et la Réforme, 2021, pp.149-164
annee_publi
2021
typdoc
Journal articles
Accès au bibtex
BibTex
titre
An order-dependent transfer model in categorization
auteur
Giulia Mezzadri, Patricia Reynaud-Bouret, Thomas Laloë, Fabien Mathy
article
2021
annee_publi
2021
resume
Most categorization models are insensitive to the order in which stimuli are presented. However, a vast array of studies have shown that the sequence received during learning can influence how categories are formed. In this paper, the objective was to better account for effects of serial order. We developed a model called Ordinal General Context Model (OGCM) based on the Generalized Context Model (GCM), which we modified to incorporate ordinal information. OGCM incorporates serial order as a feature along ordinary physical features, allowing it to account for the effect of sequential order as a form of distortion of the feature space. The comparison between the models showed that integrating serial order during learning in the OGCM provided the best account of classification of the stimuli in our data-sets.
typdoc
Preprints, Working Papers, ...
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03225670/file/An%20order-dependent%20transfer%20model%20in%20categorization%20-%202021.pdf BibTex
titre
L'Atlas Linguistique de la France à l'ère du numérique
auteur
Maeva Seffar, Carole Chauvin-Payan, Philippe Genoud, Guylaine Brun-Trigaud
article
CTHS 2021 - 145e congrès du Comité des Travaux Historiques et Scientifiques. Collecter, collectionner, conserver, Comité des Travaux Historiques et Scientifiques, May 2021, Nantes, France
annee_publi
2021
typdoc
Conference papers
Accès au bibtex
BibTex
titre
Laurent Chiflet. Essay d'une parfaite grammaire de la langue françoise (1659).
auteur
Cendrine Pagani
article
Classiques Garnier, 2021, Descriptions et théories de la langue française, Bernard Colombat
annee_publi
2021
resume
L’Essay d’une parfaite grammaire de la langue françoise paraît en 1659 à Anvers, quelques mois après la mort de son auteur, Laurent Chiflet de la Compagnie de Jésus. Pensée pour utile aussi bien aux étrangers qu’aux curieux de la langue, cette grammaire connaîtra une large diffusion en Europe et sera rééditée jusqu’en 1722. Œuvre polymorphe, elle se présente à la fois comme une grammaire, une compilation raisonnée des Remarques, et une méthode de langue. La présente édition se fonde sur l’original de 1659. Elle s’attache à préciser les circonstances politiques et linguistiques de sa genèse, et sa place dans l’histoire de la grammaire française.
typdoc
Books
Accès au bibtex
BibTex
titre
Littérature et intelligence artificielle
auteur
Étienne Brunet, Ludovic Lebart, Laurent Vanni
article
D. Mayaffre, L. Vanni. L'intelligence artificielle des textes, Honoré Champion, pp.73-130, 2021, Lettres Numériques, 9782745356406
annee_publi
2021
resume
De Homère à Shakespeare les questions de paternité littéraire ou de datation passionnent la critique. Or le décryptage de l’ADN résout sans discussion les problèmes de criminalité ou de paternité. L’Intelligence artificielle peut-elle jouer le même rôle dans le déchiffrement des textes? C’est l’objet de la présente étude, menée conjointement dans deux corpus. Dans le premier, on aborde le roman au XXème siècle en proposant à l’algorithme du deep learning un panel de 50 textes et de 25 écrivains (parmi lesquels Roman Gary et Émile Ajar). Il s’agit de reconnaître les textes qui ont le même auteur. Le deep learning réussit l’épreuve sans faillir. Fort de cette réussite, le même algorithme est appliqué au théâtre classique. La conclusion est là aussi catégorique : Racine, Corneille et Molière se distinguent parfaitement sauf dans deux cas (Don Garcie et Les Plaideurs) où le genre vient brouiller la signature. Le présent article s’interroge sur les mécanismes mis en œuvre dans le deep learning. Il s’agit d’abord de contrôler les résultats du deep learning en les confrontant non seulement aux acquis de l’histoire littéraire mais à l’approche classique de la statistique linguistique. Diverses mesures intertextuelles ont été proposées pour tenter de distinguer les distances intra (entre les textes d’un même auteur) et les distances inter (entre les auteurs). Tantôt on évalue la distance intertextuelle à partir des fréquences basses (grâce aux formules convergentes de, Jaccard , Evrard ou Muller), tantôt on s’appuie sur les hautes fréquences en recourant à l’analyse factorielle et à l’analyse arborée. Dans les deux corpus les procédures éprouvées de la lexicométrie confirment l’approche algorithmique du deep learning. On cherche aussi à imiter la démarche du deep learning en appliquant la statistique non pas aux mots individuels mais à des chaînes obtenues par glissement de trois mots adjacents (les triplets) ou bien en séparant, comme fait le deep learning, les textes soumis à l’apprentissage et les textes proposés à la prédiction (ces derniers traités en éléments supplémentaires dans l’analyse factorielle), ou bien en recourant à d’autres méthodes relevant de la technique neuronale (cartes de Kohonen). On vise aussi à expliquer, de l’intérieur, le processus , ici convolutionnel, du deep learning. Par une démarche rétroactive , dite de déconvolution, on s’applique à retrouver les marqueurs qui ont pesé sur les choix et à en relever la trace dans le texte. Mais le but principal est de comprendre et de maîtriser la démarche du deep learning et de la guider dans ses tentatives en s’appuyant sur des procédures plus exploratoires, transparentes, interprétables à chaque étape, avec des résultats visualisés (plans, arbres) ou évalués (zones de confiance bootstrap par exemple). On montre en particulier que l’analyse de correspondance peut obtenir les mêmes résultats que le deep learning, sans se soumettre à la nécessité d’un apprentissage supervisé : en traitant les pages du corpus en vrac, au kilomètre, sans partition explicite des textes.
typdoc
Book sections
Accès au bibtex
BibTex
  • + de résultats dans la Collection HAL du laboratoire BCL