Accueil > Pages Perso > Céline Poudat

Céline Poudat

MCF HDR -  UCA

Maître de conférences HDR à l’Université Côte d’Azur.
Coresponsable du consortium CORLI avec Christophe Parisse depuis 2019.
Responsable de l’équipe Logométrie à BCL.
Membre titulaire élue du CNU section 7.

CV


Fonctions occupées

Depuis Sept. 2020 Maître de conférences HDR en Sciences du langage
Depuis Sept. 2010 Maître de conférences en Sciences du langage

  • Université Côte d’Azur depuis 2014
  • Université Paris 13 de 2010 à 2014

2008-2010 Postdoctorante CNRS, Univ. Nice Sophia Antipolis, UMR 7320 BCL
2006-2008 Postdoctorante Télécom Paris
Coordinatrice des projets de recherche R&D, Sinequa
2005-2006 ATER en anglais, Université d’Orléans
2002-2005 Allocataire de recherche / monitrice au CIES Centre

Formation et titres universitaires
Sept. 2020 Habilitation à Diriger des Recherches, Université Côte d’Azur.
Titre : Explorer un corpus textuel dans une perspective d’analyse contrastive des genres et des discours. Des observables à la méthode, du texte aux discussions de la CMR
Garante : Sylvie Mellet, DR, Université Côte d’Azur
Juin 2006 Doctorat de Sciences du langage, Université d’Orléans

Thèmes de recherche / mots clés


Je travaille sur le développement de méthodes et de parcours méthodologiques en analyse de données textuelles et exploration de corpus dans une perspective d’analyse des genres et des discours.
Mes recherches s’organisent autour de trois axes principaux : (i) la question des typologies textuelles (discours, genres, domaines, styles personnels), de leurs modes de formation à leur structuration et leur observation en corpus, au moyen de méthodes d’exploration de corpus ; (ii) le développement de méthodologies d’analyse et d’annotation des textes et des discours, de l’élaboration et de l’articulation de systèmes de descripteurs linguistiques ad hoc au choix des mesures et des méthodes pour les explorer, en interprétant et en visualisant leur déploiement d’un usage à l’autre ; et (iii) l’analyse des discussions écrites du web avec un intérêt particulier pour les échanges conflictuels dans Wikipédia.

Publications significatives (sélection)


POUDAT, Céline, WIGHAM, Ciara et LIEGEOIS, Loïc (eds.) (2020). Corpus complexes. Traitements, standardisation et analyse des corpus de communication médiée par les réseaux. Corpus, Numéro 20.
LEBART, Ludovic, PINCEMIN, Bénédicte et POUDAT, Céline (2019). Analyse des données textuelles. Presses de l’Université du Québec.
POUDAT, Céline et Ho-Dac, Lydia-Mai. (2019). « Désaccords et conflits dans le Wikipédia francophone » in Col, G. et Hanote, S. « Accord et désaccord », Travaux linguistiques du Cerlico, n°29, pp. 155-176.
POUDAT, Céline et LANDRAGIN, Frédéric (2017). Explorer un corpus textuel. Méthodes – Pratiques – Outils. Collection Champs linguistiques, De Boeck, Louvain-la-Neuve.
POUDAT, Céline, GRABAR, Natalia, PALOQUE-BERGES, Camille, CHANIER, Thierry et KUN, Jin (2017). « Wikiconflits : un corpus de discussions éditoriales conflictuelles du Wikipédia francophone » in Wigham, C.R & Ledegen, G., Corpus de communication médiée par les réseaux : construction, structuration, analyse. Collection Humanités numériques. Paris : L’Harmattan, pp. 19-36.
CHANIER, Thierry, POUDAT, Céline, SAGOT, Benoît, ANTONIADIS, Georges, WIGHAM, Ciara, HRIBA, Linda, LONGHI, Julien et SEDDAH, Djamé (2014). “The CoMeRe corpus for French : structuring and annotating heterogeneous CMC genres” in Beißwenger, M., Oostdijk, N., Storrer, A. et van den Heuvel, H. (ed.), Special Issue of Journal of Language Technology and Computational Linguistics “Building and annotating corpora of computer-mediated discourse : Issues and Challenges at the Interface of Corpus and Computational Linguistics”, pp. 1-30.
POUDAT, Céline (2014). « Du corpus au genre : l’exemple de linguistique ». Ablali, D., Badir, S. et Ducard, D. (éds.), Documents, textes, œuvres. Coll. Rivages linguistiques. Presses Universitaires de Rennes, pp. 193-210.
POUDAT, Céline et FOLLETTE, Peter (2012). “Corpora and academic writing : A contrastive analysis of research articles in biology and linguistics” in Boulton, A., Carter-Thomas, S & Rowley-Jolivet, E. (éds.), Corpus-Informed Research and Learning in ESP : Issues and Applications. Coll. Studies in Corpus Linguistics, 52. John Benjamins, pp. 167-192.
BRUNET, Étienne (2011). Ce qui compte. Écrits choisis, tome II – Méthodes statistiques. Textes édités par Céline Poudat. Préface de Ludovic Lebart. Collection Lettres numériques, vol. 11, Honoré Champion, Paris.

Site personnel

http://poudat.fr

Dernières publicationsHAL

pour l'idHal "celine-poudat" :

titre
Annoter, visualiser et spécifier les textes et les genres avec les marqueurs de RDA
auteur
Céline Poudat, Sarra El Ayari
article
Représentation du discours autre et genres de discours : de l’annotation aux enjeux communicatifs et éducatifs, Mar 2022, Créteil, France
annee_publi
2022
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
Dix ans avec CORLI
auteur
Christophe Parisse, Céline Poudat
article
Assemblée générale du consortium CAHIER, Nov 2021, Paris, France
annee_publi
2021
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
Annotation of attack speech acts in Wikipedia talk pages
auteur
Céline Poudat
article
8th Conference on Computer-Mediated Communication (CMC) and Social Media Corpora, Oct 2021, Nijmegen, Netherlands
annee_publi
2021
typdoc
Poster de conférence
Accès au bibtex
BibTex
titre
Linguistic expression of conflicts in Wikipedia talks : a pragmatic annotation of disagreements and attacks
auteur
Céline Poudat, Marie Chandelier
article
17th International Pragmatics Conference, Jun 2021, Winterthur, Switzerland
annee_publi
2021
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
Mise en place d’un centre Clarin de type K (knowledge)
auteur
Christophe Parisse, Céline Poudat
article
Rencontres Huma-Num, May 2021, Lyon, France
annee_publi
2021
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
Annoter, partager et comparer avec Glozz, Inception et TXM-URS
auteur
Lydia-Mai Ho-Dac, Céline Poudat
article
Plate-forme collaborative et participative de transcription, relecture et annotation de corpus (CORLI), May 2021, Paris, France
annee_publi
2021
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
CORLI: The French Knowledge-Centre
auteur
Efstathia Soroli, Céline Poudat, Flora Badin, Antonio Balvet, Elisabeth Delais-Roussarie, Carole Etienne, Lydia-Mai Ho-Dac, Loïc Liégeois, Christophe Parisse
article
CLARIN Annual Conference 2020, Oct 2020, Barcelone (virtual ), Spain
annee_publi
2020
resume
As a first step towards increasing reproducibility of language data and promoting scientific synergies and transparency, CORLI (Corpus, Language and Interaction), a consortium involving members from more than 20 research labs and 15 Universities, part of the French large infrastructure Huma-Num, contributes to the European research infrastructure of CLARIN through the establishment of a knowledge sharing centre: the French Clarin CORpus Language and Interactions K-Centre (CORLI K-Centre). The purpose of the CORLI K-Centre is to provide expertise in corpus linguistics and French language, and support academic communities through actions towards FAIR and Open data. We describe the development of the CORLI K-Centre, its scope, targeted audiences, as well as its intuitive and interactive online platform which centralizes and offers both proactive and reactive services about: available language resources, databases and depositories, training opportunities, and best research practices (i.e., on legal/ethical issues, data collection, metadata standardization, anonymization, annotation and analysis guidelines, corpus exploration methods, format conversions and interoperability).
typdoc
Communication dans un congrès
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03091629/file/Corli-Clarin-2020.pdf BibTex
titre
Apprendre et mesurer la conflictualité avec le deep learning ?
auteur
Céline Poudat
article
JADT 2020 - 15èmes Journées Internationales d'Analyse statistique des Données Textuelles, Jun 2020, Toulouse, France
annee_publi
2020
resume
This paper focuses on the linguistic expression of conflicts in Wikipedia. I am currently working on a pragmatic annotation task. I concentrate on the markers of disagreement and conflict (Poudat 2018, Poudat and Ho-Dac 2019) keeping in mind an objective of operative and partially automated description. In this context, I am naturally interested in the possibility of detecting disagreement and conflict in discussions. Deep learning and in particular the convolutional model (CNN) that my research team is currently implementing in Hyperbase Web (Vanni et al. 2018a&b) is very attractive for a number of reasons: on the one hand, it will allow me to assess conflict detection in discussion sequences and threads ; and on the other hand, to enrich the description and annotation of conflicts with new patterns and regularities using the TDS index.
typdoc
Communication dans un congrès
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03234268/file/2020_JADT_Poudat_article_v2.pdf BibTex
titre
Corpus complexes et standards : un retour sur le projet CoMeRe
auteur
Ciara R. Wigham, Céline Poudat
article
Corpus, 2020
annee_publi
2020
resume
Le présent article se propose de revenir sur le projet national CoMeRe (Communication Médiée par les Réseaux) en insistant sur la complexité du corpus développé. Constitué de quatorze sous-corpus variés, le corpus CoMeRe est un corpus de référence de la communication médiée par les réseaux en français. Quatorze enseignants-chercheurs de huit laboratoires différents se sont impliqués dans le projet et ont été guidés par trois mots clés lors de leurs collaborations : variété, standards et accès ouvert. Le corpus CoMeRe a ainsi été construit sur une hypothèse de variété et contient une gamme étendue d'interactions de la CMR dont nous restituons les différences et les caractéristiques principales (courriels, clavardage, SMS, forums de discussion Internet, blogs, tweets, discussions Wikipédia, interactions provenant de mondes synthétiques). Nous détaillons ensuite comme le corpus CoMeRe a été rendu interopérable : les quatorze sous-corpus ont été standardisés, suivant le modèle de l'espace d'interaction élaboré lors du projet (Chanier & Jin, 2013) d'une part et suivant les propositions de représentation standardisée des corpus de la CMR en TEI (Text Encoding Initiative, 2019) élaborées en lien avec les partenaires européens. Enfin, les collègues tenaient à diffuser le corpus en accès ouvert pour permettre son utilisation par la communauté scientifique. Nous revenons sur les retombées du projet liées à la diffusion du corpus dans la conclusion de notre article.
typdoc
Article dans une revue
Accès au texte intégral et bibtex
https://shs.hal.science/halshs-02460613/file/Wigham_Poudat_2020.pdf BibTex
titre
Corpus complexes
auteur
Céline Poudat, Ciara R. Wigham, Loïc Liégeois
article
Corpus, 20, 2020
annee_publi
2020
typdoc
N°spécial de revue/special issue
Accès au bibtex
BibTex
  • + de résultats dans la Collection HAL du laboratoire BCL
  • Voir l'ensemble des résultats sur la plateforme HAL