Rencontres Statistiques Lyonnaises

Algorithmes rapides pour l’estimation de la médiane géométrique et la classification non-supervisée "robuste" en grande dimension

par Peggy Cenac (Université de Bourgogne)

Europe/Paris
125 (Bâtiment Braconnier, UCBL)

125

Bâtiment Braconnier, UCBL

Description
Dans de grandes masses de données en grande dimension, la détection automatique de points atypiques est souvent délicate. Ces points, même s’ils sont peu nombreux, peuvent fortement perturber des indicateurs simples tels que la moyenne ou la covariance. Cet exposé se concentre sur des estimateurs robustes, qui ne sont pas trop sensibles aux données atypiques, de la médiane géométrique. Plus précisément, il est question d’un algorithme de Robbins-Monro ainsi que sa version moyennisée. Ces algorithmes ont l’avantage de ne pas nécessiter un stockage de toutes les données et de mettre à jour facilement les estimations. Nous présenterons les propriétés asymptotiques de ces estimateurs, des inégalités de concentration et des boules de confiance pour la médiane. Travail fait en collaboration avec Hervé Cardot et Antoine Godichon-Baggioni.