Dialectologie

THESOC (Thesaurus Occitan)

Acteurs : Guylaine Brun-Trigaud, Elisabetta Carpitelli, Sylvain Casagrande, Jean-Philippe Dalbera, Philippe Del Giudice, Pierre-Aurélien Georges, Albert Malfatto, Lucia Molinu, Michèle Oliviéri, Jean-Claude Ranucci.

Le THESOC est un outil de travail à la disposition des chercheurs, des pédagogues et du public, développé au sein de l’équipe D&L. Il comporte deux volets : des ressources (une base de données) et des outils d’analyse.

La base de données comporte des ressources de plusieurs types : mots, textes, sons, images. Il s’agit d’un TRESOR rassemblant une multitude de données occitanes, toutes procédant de source orale et étant précisément localisées :

données linguistiques et périlinguistiques issues d’enquêtes de terrain : cartes et carnets d’enquête des Atlas linguistiques, monographies, enregistrements audio et vidéo, documents iconographiques, ethnotextes...
données linguistiques procédant d’analyses déjà réalisées dans différents domaines : lemmatisation, étymologie, morphologie...
données bibliographiques

Quelques chiffres :

1 013 605 fiches réponses
819 fiches-localités
34 296 lemmes
1 000 fichiers-son
8 339 fiches-questions
3 754 étymons
500 dessins et photos

Références :

OLIVIÉRI M., CASAGRANDE S., BRUN-TRIGAUD G. & GEORGES P.-A. (2017), « Le Thesaurus occitan dans tous ses états », Revue française de linguistique appliquée XXII-1, 89-102.
DALBERA J.-Ph., OLIVIÉRI M., RANUCCI J.-C., BRUN-TRIGAUD G. & GEORGES P.-A. (2012), « La base de données linguistique occitane THESOC. Trésor patrimonial et instrument de recherche scientifique », Estudis Romànics, 367-387.

BDLC (Banque de Données Langue Corse)

Le programme Banque de Données Linguistiques Corses est un chantier de recherche qui repose, dès son origine, sur une collaboration Université de Corse / CNRS / Collectivité Territoriale de Corse. Dans ce cadre, un certain nombre de membres pleins et de membres associés du laboratoire BCL ont participé à la réalisation de ce programme. La BDLC est la “grande soeur” du THESOC.

Cette collecte de données linguistiques, liée au Nouvel Atlas Linguistique de la Corse, donne la primauté aux sources d’information orales. Les données sont recueillies par voie d’enquête auprès de locuteurs corsophones natifs, enregistrées sur bande magnétique ou support numérique puis transcrites.

Il s’agit d’un outil destiné à rendre des services multiples tant au niveau de la recherche que de la pédagogie.

L’accès aux informations contenues dans la base est rendu possible par un dialogue simple et permanent avec la machine. Ces informations sont essentiellement d’ordre linguistique mais peuvent également faire l’objet d’informations complémentaires, d’ordre ethnolinguistique (sons, photos, vidéo…).

Quel(s) est(sont) le(s) terme(s) corse(s) utilisé(s) pour désigner telle ou telle notion ?
A quel mot français correspond tel mot corse ?
Quelles sont les variantes régionales en usage ?
Comment se répartissent ces variantes dans l’espace insulaire ? (on peut afficher une carte représentant les faits)
Comment se prononcent ces variantes ? On a accès à une transcription phonétique, et parfois à la forme enregistrée.

La numérisation des données sonores, iconographiques et vidéo est en cours.

Sahelia (BDD dialectologique et lexicologique sur la zone sahelo-saharienne)

Responsable : R. Nicolaï (ancien membre du laboratoire BCL)

Cette base de données est dédiée à la recherche comparative dans le domaine lexical et peut également être utilisée comme un auxiliaire dans l’approche lexicologique. Elle est utile pour toute étude nécessitant la comparaison de données empiriques, qu’elle soit d’ordre linguistique (recherche d’apparentements génétiques, dialectologie, contact des langues, phénomènes de diffusion lexicale, analyse des faits de convergence et de divergence) ou d’un autre ordre plus “anthropologique” (classifications populaires, organisation culturelle et sémantique des univers linguistiques, etc.).

La base de données s’appuie sur le logiciel Mariama en version 2.1 Cet outil permet d’exploiter la base de données par les fonctions “classiques” : recherches, tris, importations, exportations, habituellement attendues d’un programme de gestion de fiches ; mais aussi par un ensemble de fonctions particulières en rapport avec sa finalité propre.

Comment consulter la base Sahelia

La base Sahelia n’est malheureusement plus disponible en ligne.

Cependant, l’essentiel des données de Sahelia a été intégré dans le projet REFLEX développé par le LLACAN, notamment grâce à Jeanne Zerner et Guillaume Segerer.

Vous pourrez également obtenir une copie plus complète de la base Sahelia et du logiciel MARIAMA en contactant directement son auteur (nicolai AT unice POINT fr).