Séminaire de Statistique et Optimisation

Comportement asymptotique de la validation croisée au voisinage du modèle optimal

par Guillaume Maillard

Europe/Paris
Salle K. Johnson, 1er étage (1R3)

Salle K. Johnson, 1er étage

1R3

Description
Lorsqu'elle est utilisée pour estimer le risque d'un seul estimateur, le comportement asymptotique de la validation croisée peut s'analyser à l'aide d'un calcul de variance accompagné d'un théorème central limite. En sélection de modèles, cependant, la validation croisée est appliquée simultanément à plusieurs estimateurs afin de les comparer. Pour analyser la VC dans ce cas, il faut donc établir un TCL vectoriel ou fonctionnel.  Comme la moyenne et la variance du processus peuvent être très différentes d'un modèle à l'autre, les paramètres de localisation et d'échelle doivent être judicieusement choisis.
Dans cet exposé, nous considérerons le cas de l'estimation de densité L^2 à l'aide de modèles constitués de polynômes trigonométriques. Il est alors possible de décrire les fluctuations aléatoires de certains critères de VC au voisinage du modèle optimal, à l'échelle critique où celle-ci deviennent significatives. Asymptotiquement, la VC s'écrit comme la somme d'une fonction convexe déterministe et d'un mouvement Brownien symétrisé composé avec une fonction croissante déterministe. Ce résultat permet notamment de caractériser l'ordre de grandeur des fluctuations du modèle sélectionné par validation simple.