Accueil > Formation > Doctorat > Thèses en cours > Modèles temporels de l’apprentissage chez l’humain

Giulia Mezzadri [2016 – ]

Modèles temporels de l’apprentissage chez l’humain

Sous la direction de Fabien Mathy et Patricia Reynaud-Bouret

Avec quelle stratégie de visite un agent immobilier a-t-il le plus de chance de vendre un bien ? Doit-il commencer par les pièces les plus agréables (et montrer les plus sordides en dernier) sachant que c’est la première impression qui compte ou doit-il proposer la visite inverse sachant que le client terminera avec une bonne impression ? Nous pensons que ces séquences de présentation alternatives conduisent irrémédiablement à deux représentations différentes du logement visité, comme c’est le cas dans le diagnostic médical [1] (lorsqu’on varie l’ordre d’une checklist), dans la reconnaissance de criminels [2], ou encore la catégorisation.

Le domaine de la catégorisation demande une modélisation spécifique de la mémoire naïve ou experte dévolue au classement de stimuli groupés dans des classes. Ces modèles d’apprentissage pour l’humain permettent non seulement de modéliser les capacités cérébrales mais permettent aussi de faciliter la classification par coopération entre machines et humains (les machines pouvant faciliter la tâches aux humains en déterminant quelles sont les images références de chaque catégorie), voire même d’améliorer la reconnaissance automatique de patterns par des machines (algorithmes de type machine learning) [3,4].

Un problème majeur dans ce domaine est qu’en informatique comme en psychologie, les tests et simulations des modèles contrôlent la plupart du temps les effets d’ordre par des présentations aléatoires des stimuli. Ce tirage aléatoire présente le défaut de ne pas bien discriminer les modèles (qui parfois font des prédictions proches), et il empêche de tester l’aspect incrémental de la mémorisation des stimuli (et subséquemment les courbes d’apprentissage).

En psychologie cognitive, la littérature a montré que l’ordonnancement manipulé des stimuli semble déterminer la qualité et la rapidité d’une séance d’apprentissage chez l’humain, comme le montre des travaux récents sur l’apprentissage massé ou distribué [5]. Par exemple, l’apprentissage distribué revient à alterner les catégories, ce qui invite le participant à trouver des différences entre catégories, alors que l’apprentissage massé revient à trouver des similitudes entre les stimuli d’une même catégorie lorsqu’ils sont présentés de façon groupée temporellement. En revanche, plus rares sont les travaux qui s’intéressent de façon plus fine aux ordonnancements des stimuli dans une catégorie donnée. Quelques rares résultats préliminaires semblent montrer que les participants sont plus performants lorsque l’ordonnancement des stimuli suit une logique d’abstraction de règles [6,7]. Ce résultat complète les recherches antérieures qui ont fait uniquement état d’un bénéfice à utiliser des ordres de présentation par similarité [8,9]. De façon plus large, l’ensemble de ces résultats semblent montrer que les ordres par similarité, bien qu’efficaces en comparaison des ordres aléatoires, tendent à induire la formation d’hypothèses trop spécifiques qui ralentissent l’apprentissage.

L’objectif principal de ce doctorat est de modéliser de manière fine l’effet temporel des ordres de présentation, de simuler les performances des participants humains et enfin de confronter ces nouveaux modèles aux concurrents. Ce travail doit viser à modéliser non seulement les vitesses d’apprentissage et les temps de classification (i.e., les aspects chronométriques) mais aussi de déterminer par des procédures de tests statistiques quel modèle est le plus adapté et donc quelle est la nature des représentations mentales (i.e., les aspects qualitatifs, comme la formation de clusters ou d’exemplaires). A l’heure actuelle, une extension du modèle à exemplaires développé par Nosofsky (GCM, General Context Model) est en court de développement par F. Mathy (co directeur, psychologue), en ajoutant à ce modèle un calcul de discriminabilité fondé sur les distances temporelles entre stimuli, par analogie avec un modèle récent de la mémoire à court-terme [10]. Cependant, ce modèle est limité à la prédiction d’effets sériels, et non temporels.

Le principe de cette thèse est d’aller plus loin dans le développement de ces modèles grâce à l’utilisation de processus de comptage marqués. Ce type de modèles probabilistes permet de modéliser finement les interactions entre durées de réponse, ordre/temps d’apparition des stimulus, en utilisant une distance entre stimulus encore à déterminer. Certains d’entre eux comme les processus de Hawkes sont déjà utilisés en neuroscience pour modéliser les interactions entre neurones et P. Reynaud-Bouret (directrice, mathématicienne) a déjà développé des tests statistiques dans ce cadre, à la fois de goodness-of-fit mais aussi de détection de dépendance [11,12]. Nous voulons donc créer de nouveaux modèles de type processus de comptage marqués qui permettent de modéliser l’effet d’une présentation par ordre de similarité grâce à une distance basée par exemple sur cette similarité. Selon les modèles envisagés, on peut arriver à modéliser l’apprentissage (de règles) associé à une présentation du cluster le plus large (i.e., la règle) suivi des plus petits clusters (i.e., les exceptions), et comparer à une présentation aléatoire dans les clusters favorisant l’abstraction des traits diagnostiques. Une troisième personne, Thomas Laloë, spécialiste en apprentissage statistique de type k plus proches voisins et en estimation d’ensemble de niveau [13,14], interviendra dans cette thèse pour créer entre autres des modèles basés sur des distances utilisées de manière courante dans la communauté machine learning et les comparer statistiquement à des modèles plus psychologiquement inspirés comme [10] pour voir quelles approches sont plus adaptées à une modélisation de l’apprentissage chez l’humain.

Références :

[1] Kwan, V. S. Y., Wojcik, S. P., Miron-Shatz, T., Votruba, A. M., & Olivola, C. Y. (2012). Effects of symptom presentation orderonperceived disease risk. Psychological science, 23, 381–385.

[2] Wells, G. L. (2014). Eyewitness identification : Probative value, criterion shifts, and policy regarding the sequential lineup. Current Directions in Psychological Science, 23, 11-16.

[3] Duda, Hart (2000), Pattern Classification.

[4] Pothos, Wills (2011), Formal approaches of classification.

[5] Kornell, N., Bjork, R. A. (2008). Learning concepts and categories : is spacing the ”enemy of induction” ? Psychological Science, 19, 585-592.

[6] Kang, S. H. K., Pashler, H. (2012). Learning painting styles : Spacing is advantageous when it promotes discriminative contrast. Applied Cognitive Psychology, 26, 97-103.

[7] Mathy, F., Feldman, J. (2009). A rule-based presentation order facilitates category learning. Psychonomic Bulletin & Review, 16, 1050-1057.

[8] Elio, R., Anderson, J. R. (1981). Effects of category generalizations and instance similarity on schema abstraction. Journal of Experimental Psychology : Human Learning and Memory, 7, 397-417.

[9] Medin, D. L., Bettger, J. G. (1994). Presentation order and recognition of categorically related examples. Psychonomic Bulletin & Review, 1, 250-254.

[10] Brown, G. D. A., Neath, I., Chater, N. (2007). A temporal ratio model of memory. Psychological Review, 114, 539-576.

[11] Reynaud-Bouret, P. , Rivoirard, V., Grammont , F., Tuleau-Malot, C. (2014)
Goodness-of-fit tests and nonparametric adaptive estimation for spike train analysis, Journal of Mathematical Neuroscience, 4:3.

[12] Albert, M., Bouret, Y., Fromont, M., Reynaud-Bouret, P. (2015) Bootstrap and permutation tests of independence for point processes, Annals of Statistics, 43(6), 2537-2564.

[13] Laloë, T. (2008). A k-nearest neighbor approach for functional regression , Statistics & probability letters.

[14] Di Bernardino, E., Laloë, T., Servien, R. (2015). Estimating covariate functions associated to multivariate risks : a level sets approach, Metrika.

publié par Pierre-Aurélien GEORGES - mis à jour le