Phonologie

Synchronie et diachronie de la longueur vocalique en allemand

Corpus issu de la thèse d’Emilie Caratini intitulée : “The relationship between vowel length and consonant(cluster)s in German : synchronic and diachronic perspectives” (“De la relation existant entre la quantité vocalique et les (groupes de) consonnes en allemand : synchronie et diachronie”).

Il s’agit d’un corpus raisonné de 15 832 formes de l’allemand moderne* dont l’étymologie a été recueillie. Les entrées de la base de données sont classées en fonction de différents critères morpho-phonologiques.

Les liens ci-dessous vous donnent accès aux deux premières versions officielles de la base de données (octobre 2004 et juin 2005) qui ne contenaient alors respectivement que quelques 11 588 et 11 508 formes :

La version définitive du corpus sera disponible en ligne après la soutenance.

* dont 6 530 formes d’origine allemande, i.e. 6 530 formes attestées en pré-nouveau haut allemand / moyen haut allemand / vieux haut allemand.

Epenthèse consonantique en français

Base de données issue de la thèse de Claudine Pagliano intitulée

“L’épenthèse consonantique en français. Ce que la syntaxe, la sémantique et la morphologie peuvent faire à la phonologie”

et soutenue en 2003 au laboratoire.

Base de données regroupant 859 mots dérivés du français qui comportent une consonne épenthétique entre le radical et le suffixe (numéro-t-er), accompagnés d’indications permettant leur tri : taille de la base du dérivé, catégories syntaxiques de la base et du dérivé, nature de la consonne épenthésée, contexte, définition, etc.

šatrovački

Auteur : Olivier Rizzolo.

Corpus de 194 termes de šatrovački, homologue serbo-croate du verlan français. Y figurent les entrées correspondantes en serbo-croate standard ainsi que les principaux phénomènes morpho-phonologiques associés (notamment, quand elles existent, les flexions nominales et verbales des formes verlanisées).

#RT en slave

Auteur : Tobias Scheer.

Exhaustive list of words with initial Sonorant-Obstruent clusters in 13 Slavic languages.

The introductory part of the data base provides detailed explanation regarding the goal and scope of the corpus, how it was constructed, how it is organised, what you can do in order to improve it and where it has been used.

Goal and scope
Since 2000, I have attempted to establish a data base which provides the exhaustive record of words that begin with a sonorant-obstruent cluster in 13 Slavic languages : Czech, Slovak, Polish, Upper Sorbian, Lower Sorbian, Kashubian (West), Bulgarian, Macedonian, Bosno-Serbo-Croatian, Slovenian (South), Russian, Ukrainian, Bielorussian (Est).

The purpose is to dispose of a solid empirical basis that documents a typical typological feature for which Slavic languages are famous : the violation of sonority sequencing at the beginning of the word. While it is well known that Slavic languages have non-orthodox initial clusters, there does not seem to be a comparative record that would tell us precisely which languages have these clusters, how many of them are encountered, exactly which clusters occur and which do not. For the time being, the corpus does not include #RR and #TT clusters (R is shorthand for sonorants, T for obstruents). In a first step, I have privileged the clusters that are most offending for sonority sequencing, and this has turned out to be enough work. It is to be hoped that at some point the list of Slavic #RR- and #TT-words will also be available.

Longueur vocalique du préfixe tchèque za-

Base de données issue de l’Habilitation à Diriger des Recherches de Tobias Scheer (soutenue en 2000).

Base de données réunissant tous les mots tchèques contenus dans le dictionnaire Ulbrich (1978) qui sont préfixés par za- (1575 entrées). Toutes les entrées sont classées en fonction des suffixes qu’elles possèdent (total d’une quarantaine de suffixes différents pour toute la base).

La dernière voyelle de tous les préfixes à finale vocalique, en tchèque, connaît une alternance de longueur (p.ex. zá-bava vs. za-bavení).

Pour télécharger la base (.xls), aller sur cette page, puis dans la rubrique “books and theses”, télécharger l’annexe2 de Scheer (2000).

Vocalisation des préfixes tchèques à finale consonantique

Corpus issu de la thèse de Tobias Scheer (soutenue en 1996).

Corpus réunissant tous les mots tchèques contenus dans le dictionnaire Ulbrich (1978) qui sont construits à l’aide d’un préfixe à finale consonantique (957 entrées). Les préfixes en question ont la particularité d’apparaître tantôt avec une voyelle finale (beze-), tantôt sans cette voyelle (bez-). L’objectif est de prédire les conditions dans lesquelles les préfixes sont vocalisés.

La base de données se trouve dans l’annexe de la thèse, qui peut être téléchargée sur cette page (rubrique “books and theses”, télécharger Scheer 1996).