Nos tutelles

CNRS UNS

Nos partenaires

ILF MSHS-SE

Rechercher




Accueil > Pages Perso > Pierre-Aurélien Georges

Pierre-Aurélien GEORGES

IR -  CNRS

Programmes en cours

  • Thesaurus Occitan (Thesoc)

    • Responsable du développement informatique de la base lexicale
      et du Module Morpho-Syntaxique (MMS)
    • Responsable du site internet
  • Participation au projet ANR franco-allemand DADDIPRO 2012-2015 
    "
    Dialectal, acquisitional, and diachronic data and investigations on subject pronouns in Gallo-Romance". 
    UNS - UMR 7320 (France) & Universität Konstanz (Allemagne)

 

Responsabilités diverses

  • Responsable du service informatique
  • CSSI (Chargé de la Sécurité des Systèmes d’Information)
  • Membre du noyau d’animateurs du réseau métier régional Admin06

 

Dernières publicationsHAL

pour l'idHal "pierre-aurelien-georges" :

titre
Traitement syntaxique pour l'occitan
auteur
Pierre-Aurélien Georges
article
Technologies pour les Langues Régionales de France, Feb 2015, Meudon, France. pp.112-121, 2016, Les technologies pour les langues régionales de France. <http://tlrf2015.sciencesconf.org/>
annee_publi
2015
resume
Il ne s’agira pas ici d’évoquer le traitement syntaxique à proprement parler, mais plutôt la conception d’une base de données dédiée à la syntaxe et morpho-syntaxe des dialectes occitans. Ce sera l’occasion de présenter les pistes que nous avons suivies et les réflexions que nous avons eues concernant l’intégration d’un certain nombre d’outils de traitement linguistique sur cette base.
typdoc
Communication dans un congrès
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01239538/file/TLRF_PAG.pdf BibTex
titre
The 'THESAURUS OCCITAN' Morpho-Syntactic Module
auteur
Michèle Oliviéri, Pierre-Aurélien Georges
article
International Exploratory Workshop "Partitivity in Romance and Beyond", Dec 2014, Universität Zürich, Switzerland. 2014
annee_publi
2014
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
The Thesaurus Occitan: a multimedia database dedicated to occitan dialects.
auteur
Pierre-Aurélien Georges
article
Jose Luis ORMAETXEA; Gotzon AURREKOETXEA OLABARRI. Tools for Linguistic Variation (EUDIA-2), Oct 2009, Vitoria Gasteiz, Spain. ASJU-ren gehigarriak, LIII, UPV-EHU, Bilbao, Tools for Linguistic Variation (LIII), pp.107-118, 2010, Anejos del Anuario del Seminario de Filología Vascoa "Julio de Urquijo". <https://sites.google.com/site/edakeudia/Home/aurkibidea/jardunaldi-biltzar/hizkuntza-bariazioa-aztertzeko-teknologia-jardunaldi-internazionala>
annee_publi
2009
resume
The Module MorphoSyntaxique (abbreviated MMS) is a computer tool especially designed for syntactic and morpho-syntactic analysis of Occitan dialects. It is part of the Thesaurus Occitan multimedia database (of which a general presentation can be found in these proceedings in another article by Guylaine Brun-Trigaud). Following the THESOC's general guidelines (i.e. localised and oral data only), this module contains both oral texts (including ethnotexts) and single sentences, such as answers to morphosyntactic questionnaires. The "oral data" criteria can be somewhat flexed: even if this module was originally conceived for oral data processing, its part-of-speech tagger and syntactic parser are still able to process written texts so far as they are written in a familiar or popular style, close to oral register. The locations where all these texts and sentences have been harvested are stored in the database, thus enabling on the long term a comparison between different dialects on a morphosyntactical or syntactical basis, thus opening new perspectives for dialectology.
typdoc
Communication dans un congrès
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01277767/file/PAG%20Vitoria%20Gasteiz%202009.pdf BibTex
titre
Les chaînes de clitiques : l'outil informatique au service de l'analyse comparative
auteur
Pierre-Aurélien Georges
article
Mémoires du terrain : enquêtes, matériaux, traitement des données, Mar 2009, Lyon, France. pp.157-177, 2013, <http://facdeslangues.univ-lyon3.fr/memoires-du-terrain-enquetes-materiaux-traitement-des-donnees-294107.kjsp?RH=INS-LANcel_arch>
annee_publi
2009
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
Le THESOC : bases de données et outils d'analyse consacrés à l'étude des dialectes occitans
auteur
Pierre-Aurélien Georges
article
Christine Blauth-Henke; Matthias Heinz. Bases de données, Méthodes, Modèles de description : de nouvelles perspectives pour la recherche sur les langues régionales et minoritaires ?, Dec 2008, Tübingen, Allemagne. Stauffenburg Verlag, Où en sont les études des langues régionales en domaine roman ? Données - méthodes - modèles de description, pp.97-114, 2011, DeLingulis : European Studies on Lesser Used Languages. <http://www.stauffenburg.de/asp/books.asp?id=1176>
annee_publi
2008
resume
Au cours des dernières années, les bases de données, les méthodes ainsi que lesmodèles de description ont connu des évolutions parfois bouleversantes. C'estpourquoi la question de savoir si ces changements ont influencé la recherche surles langues régionales et minoritaires - ou bien quel pourrait être leur apportpour cette recherche - nous paraît d'un intérêt majeur. Par exemple, ladocumentation de ces langues est beaucoup plus difficile que pour les languesnationales (nombre de locuteurs, domaines d'emploi?). Néanmoins,l'informatisation de textes et des bases de données, souvent difficilementaccessibles, ouvre de nouvelles perspectives - ce qui se reflète dans desprojets tels que le THESOC.
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
Présentation de la base Textes associée au THESOC
auteur
Pierre-Aurélien Georges
article
Brigitte Horiot. La dialectologie hier et aujourd'hui (1906-2006), Dec 2006, Lyon, France. Université de Lyon III Jean Moulin, Lyon, La dialectologie hier et aujourd'hui (1906-2006), pp.81-93, Centre d'études linguistiques Jacques Goudet. Série Dialectologie. <http://facdeslangues.univ-lyon3.fr/la-dialectologie-hier-et-aujourd-hui-1906-2006--109475.kjsp?RH=INS-LANcel_arch>
annee_publi
2006
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
Présentation de la base TEXTES du THESAURUS OCCITAN
auteur
Pierre-Aurélien Georges
article
Huitième congrès international de l'AIEO, Sep 2005, Bordeaux, France
annee_publi
2005
typdoc
Communication dans un congrès
Accès au bibtex
BibTex
titre
THESAURUS OCCITAN (THESOC)
auteur
Jean-Philippe Dalbera, Dominique Strazzabosco, Michèle Oliviéri, Pierre-Aurélien Georges
article
BCL_MAJ_id=3569. base de données des dialectes occitans. 1992
annee_publi
1992
typdoc
Autre publication
Accès au bibtex
BibTex
  • + de résultats dans la Collection HAL du laboratoire BCL
  • Voir l'ensemble des résultats sur la plateforme HAL
  • Anciennes productions