Rencontres Statistiques Lyonnaises

Introduction à certains problèmes de décisions séquentielles

par Aurélien Garivier

Europe/Paris
séminaire 2 (Braconnier)

séminaire 2

Braconnier

Description

 Que ce soit pour les systèmes de recommandation, pour l'allocation dynamique de ressources ou pour l'exploration des arbres dans les jeux, de nombreux systèmes de décision automatiques s'appuient sur le modèle simple dit du "bandit manchot" où un agent doit choisir, à chaque instant, une source aléatoire dont il observe ensuite une réalisation.
Nous présenterons dans cet exposé quelques stratégies permettant d'exploiter au mieux ces sources.

Dans la première partie, introductive, présentera simplement le modèle et quelques idées générales pour son étude statistique. Dans une deuxième partie, nous verrons comment inégalités d'information et inégalités de déviations auto-normalisées permettent d'identifier finement la complexité de certaines tâches à résoudre.

Your browser is out of date!

Update your browser to view this website correctly. Update my browser now

×