Rencontres Statistiques Lyonnaises

Analyse des données arborescentes (suite et fin)

par Romain Azaïs (INRIA, équipe MOSAIC, laboratoire RDP, ENS Lyon)

Europe/Paris
125 (Bât. Braconnier)

125

Bât. Braconnier

Description
Au départ, un constat : de nombreuses expérimentations, notamment en biologie, donnent lieu à des mesures qui prennent la forme d'arborescences. Il peut s'agir de réseaux sanguins ou de la structure d'une plante. Le premier réflexe pour analyser ces données est de tenter de résumer leur structure combinatoire par un vecteur de descripteurs. Cette technique permet parfois de répondre aux questions posées, mais la perte d'information qu'elle engendre peut être rédhibitoire. Il est donc nécessaire de proposer de nouvelles méthodes. Mon exposé est scindé en deux parties. Dans la première (exposé du 30 mars), j'ai présenté des techniques d'approximation des arbres non-ordonnés inspirées d'algorithmes de compression sans perte, en montrant l'intérêt de ces méthodes dans des problèmes de clustering. La seconde partie sera dédiée à des problèmes d'estimation pour des modèles de Galton-Watson conditionnés (par la taille ou la hauteur) via leur limite locale. Le tout sera illustré par des simulations et des applications à des données réelles.