Rencontres Statistiques Lyonnaises

Introduction à l'acp fonctionnelle + Minimax estimation of Functional Principal Components from noisy discretized functional data

by Ryad Belhakem (Université Paris Dauphine)

Europe/Paris
salle Fokko du Cloux bât Braconnier (Lyon 1 - Doua)

salle Fokko du Cloux bât Braconnier

Lyon 1 - Doua

Description
Introduction à l'acp fonctionnelle par Ryad Belhakem ~ 30 minutes
 
L'acp fonctionnelle est une généralisation de l'acp classique lorsque les données sont des fonctions, des courbes ou des trajectoires. De telles données surviennent tout naturellement dans des domaines différents. Par exemple dans les phénomènes où les mesures proviennent d'un processus automatisé de collecte de données (mesures de termperature, charge sur un réseau éléctrique..).
Les fonctions de données observées doivent être pensées comme des entités uniques plutôt qu'une suite d'observations individuelles : le terme fonctionnel fait référence à la structure intrinsèque des données plutôt qu'à leur forme explicite. En effet, d'un point de vue pratique, les données fonctionnelles sont généralement observés et enregistrés discrètement. Ce cadre d'approche fournit des outils supplémentaires pour l'analyse de données en grande dimension.
 
Pause (café)  ~ 15 minutes
 
Minimax estimation of Functional Principal Components from noisy discretized functional data.  Ryad Belhakem  ~ 45 minutes
 
Functional Principal Component Analysis is a reference method for dimension reduction of curve data. Its theoretical properties are now well understood in the simplified case where the sample curves are fully observed without noise. However, functional data are noisy and necessarily observed on a finite discretization grid. Common practice consists in smoothing the data and then to compute the functional estimates, but the impact of this denoising step on the procedure’s statistical performance are rarely considered. Here we prove new convergence rates for functional principal component estimators. We introduce a double asymptotic framework: one corresponding to the sampling size and a second to the size of the grid. We prove that estimates based on projection onto histograms show optimal rates in a minimax sense. Theoretical results are illustrated on simulated data and the method is applied to the visualization of genomic data.