La communauté microbienne complexe qui vit dans le système digestif humain, connue sous le nom de microbiote intestinal, remplit de nombreuses fonctions importantes pour son hôte et est désormais reconnue comme un facteur crucial dans le maintien de la santé. De nombreuses études suggèrent qu'il pourrait être utilisé comme outil médical pour le diagnostic, le pronostic et même la prédiction de la réponse au traitement d'un patient.
Cependant, la structure spécifique du microbiote intestinal (notamment parcimonieuse, compositionnelle et avec une structure hiérarchique) a été peu prise en compte jusqu'à présent. En s'inspirant de l'approche Poisson-Log-Normal (PLN) développée pour modéliser les données de comptage dépendantes, nous introduisons le modèle PLN-Tree, spécifiquement conçu pour modéliser des données de comptage hiérarchiques. En intégrant des techniques d'inférence variationnelle structurée, nous proposons une procédure d'apprentissage adaptée et établissons des résultats d'identifiabilité. Des évaluations numériques sur des données synthétiques ainsi que sur des données de microbiote démontrent l'intérêt de prendre en compte la structure hiérarchique des données pour détecter des dépendances complexes.