Séminaire de Probabilités commun ICJ/UMPA

Yann Ollivier, "Ajustement de systèmes dynamiques"

Europe/Paris
salle 435 (UMPA)

salle 435

UMPA

Description
L'apprentissage des paramètres d'un système dynamique pour que ses trajectoires présentent des propriétés voulues est au coeur de l'utilisation des réseaux de neurones pour modéliser des données temporelles (texte, séries numériques, traduction automatique...). Une approche standard est une descente de gradient stochastique sur un signal d'erreur. Malheureusement cet algorithme a l'inconvénient de "remonter le temps" le long de la trajectoire, ce qui nécessite de l'entraîner à partir d'un grand nombre de trajectoires courtes qui sont chacune analysées en partant de la fin. Cela rend impossible l'apprentissage en temps réel. Un problème similaire se retrouve dans d'autres modèles, par exemple, l'ajustement de modèles markoviens pour prédire des observations. Nous présenterons une analyse mathématique de la convergence de nouveaux algorithmes pour l'ajustement en temps réel d'un système dynamique. Contrairement aux approches précédentes, nous n'avons pas besoin d'hypothèses probabilistes sur l'environnement du système.
de la même série
2 3 4 5 6 7 8 9 10 11 12 13