Séminaire des Doctorants et Doctorantes

Identification de Meilleur Bras dans les Problèmes de Bandits

par Antoine Barrier (ENS de Lyon & Université Paris-Saclay)

Europe/Paris
salle Lilas (UMPA)

salle Lilas

UMPA

Description

Imaginez que vous ayez en votre possession des prototypes de médicaments contre une maladie. Vous souhaitez déterminer quel médicament est le plus efficace et pour cela, vous pouvez choisir séquentiellement (i.e. un par un) un des médicaments, l’administrer à un malade et observer sa réaction. Quelle sera votre stratégie : allez-vous directement éliminer les médicaments qui ne fonctionnent par sur leurs premières tentatives, ou leur laisser une seconde chance ? Quel médicament administrerez-vous au prochain patient ? Quand allez-vous vous arrêter et décider que vous avez assez d’information pour savoir quel est le meilleur médicament ?

Dans cet exposé, je présenterai un cadre permettant de modéliser la situation ci-dessus : les problèmes de bandits. J’introduirai quelques stratégies et étudierai leurs propriétés. Guidé par des applications, je discuterai de deux approches possibles et montrerai que leur compréhension mathématique diffère.