Les personnes qui possèdent un compte PLM-Mathrice sont invités à l'utiliser.
Séminaire de Probabilités commun ICJ/UMPA

Yann Ollivier, "Ajustement de systèmes dynamiques"

jeudi 9 novembre 2017 de au (Europe/Paris)
at UMPA ( salle 435 )
Description
L'apprentissage des paramètres d'un système dynamique pour que ses
trajectoires présentent des propriétés voulues est au coeur de
l'utilisation des réseaux de neurones pour modéliser des données
temporelles (texte, séries numériques, traduction automatique...).

Une approche standard est une descente de gradient stochastique sur un
signal d'erreur. Malheureusement cet algorithme a l'inconvénient de
"remonter le temps" le long de la trajectoire, ce qui nécessite de 
l'entraîner à partir d'un grand nombre de trajectoires courtes qui sont
chacune analysées en partant de la fin. Cela rend impossible
l'apprentissage en temps réel.
 
Un problème similaire se retrouve dans d'autres modèles, par exemple,
l'ajustement de modèles markoviens pour prédire des observations.

Nous présenterons une analyse mathématique de la convergence de nouveaux
algorithmes pour l'ajustement en temps réel d'un système dynamique.
Contrairement aux approches précédentes, nous n'avons pas besoin
d'hypothèses probabilistes sur l'environnement du système.
Documents: