écouter l'apprentissage par renforcement

Ce projet de recherche a étudié la façon dont les gens perçoivent l'apprentissage par renforcement à travers le son.

Ce projet a servi d'étape préliminaire au design d'un workflow expressif permettant aux humains d'apprendre des comportements spécifiques à des agents d'apprentissage par renforcement par le biais de préférences subjectives. Ce workflow a finalement été mis en œuvre et évalué au sein du design du Co-Explorer.

Nous avons mené une expérience contrôlée, demandant aux participant·es de guider trois types d'agents, dans deux environnements de synthèse sonore, en utilisant un renforcement positif ou négatif. Un agent avait un comportement d'exploration, un autre d'exploitation, et un autre équilibrait exploitation et exploration ; un environnement sonore avait des attributs timbraux linéaires, et un autre avait une obstruction timbrale.

Les participant·es ont réussi à interagir avec les trois agents pour atteindre leur objectif sonore. Des mesures quantitatives ont montré que le comportement d'exploration des agents, plutôt que leur apprentissage à atteindre un objectif sonore, était essentiel pour que les participant·es les perçoivent comme collaboratifs.

Année
2018

Crédits
Le projet a été développé avec Frédéric Bevilacqua et Baptiste Caramiaux, en collaboration avec ISMM (groupe de Ircam et ex)situ (groupe de LRI (INRIA)), dans le cadre d'une thèse de doctorat menée à Sorbonne Université.

Publication
Article à SMC (2018)

Ce diaporama nécessite JavaScript.