Rencontres Statistiques Lyonnaises

Quelques pistes pour l'analyse des données arborescentes

par Romain Azaïs (INRIA)

Europe/Paris
Fokko du Cloux (Braconnier)

Fokko du Cloux

Braconnier

Description
Au départ, un constat : de nombreuses expérimentations, notamment en biologie, donnent lieu à des mesures qui prennent la forme d'arborescences. Il peut s'agir de réseaux sanguins ou de la structure d'une plante. Le premier réflexe pour analyser ces données est de tenter de résumer leur structure combinatoire par un vecteur de descripteurs. Cette technique permet parfois de répondre aux questions posées, mais la perte d'information qu'elle engendre peut être rédhibitoire. Il est donc nécessaire de proposer de nouvelles méthodes. Mon exposé sera scindé en deux parties. Dans la première, je présenterai sous la forme d'un groupe de travail des techniques d'approximation des arbres non-ordonnés inspirées d'algorithmes de compression sans perte. Je montrerai l'intérêt de ces méthodes dans des problèmes de clustering. La seconde partie sera dédiée à des problèmes d'estimation pour des modèles de Galton-Watson conditionnés (par la taille ou la hauteur) via leur limite locale. Le tout sera illustré par des simulations et des applications à des données réelles.