Créateur : Jean-Philippe Dalbera
Responsable : Michèle Oliviéri
Acteurs : Guylaine Brun-Trigaud, Elisabetta Carpitelli, Sylvain Casagrande, Jean-Philippe Dalbera, Philippe Del Giudice, Pierre-Aurélien Georges, Albert Malfatto, Lucia Molinu, Michèle Oliviéri, Jean-Claude Ranucci.
Le THESOC est un outil de travail à la disposition des chercheurs, des pédagogues et du public, développé au sein de l’équipe D&L. Il comporte deux volets : des ressources (une base de données) et des outils d’analyse (Cf. Logiciels).
La base de données comporte des ressources de plusieurs types : mots, textes, sons, images. Il s’agit d’un TRESOR rassemblant une multitude de données occitanes, toutes procédant de source orale et étant précisément localisées :
- données linguistiques et périlinguistiques issues d’enquêtes de terrain : cartes et carnets d’enquête des Atlas linguistiques, monographies, enregistrements audio et vidéo, documents iconographiques, ethnotextes...
- données linguistiques procédant d’analyses déjà réalisées dans différents domaines : lemmatisation, étymologie, morphologie...
- données bibliographiques
Quelques chiffres :
1 013 605 fiches réponses
819 fiches-localités
34 296 lemmes
1 000 fichiers-son
8 339 fiches-questions
3 754 étymons
500 dessins et photos
Références :
OLIVIÉRI M., CASAGRANDE S., BRUN-TRIGAUD G. & GEORGES P.-A. (2017), « Le Thesaurus occitan dans tous ses états », Revue française de linguistique appliquée XXII-1, 89-102.
DALBERA J.-Ph., OLIVIÉRI M., RANUCCI J.-C., BRUN-TRIGAUD G. & GEORGES P.-A. (2012), « La base de données linguistique occitane THESOC. Trésor patrimonial et instrument de recherche scientifique », Estudis Romànics, 367-387.
Une partie de ces données sont consultables sur le site web du Thesaurus Occitan (THESOC).