12–13 nov. 2018
Toulouse School of Economics
Fuseau horaire Europe/Paris

Un outil général de modélisation linéaire généralisée en grande dimension: les composantes supervisées

13 nov. 2018, 14:20
50m
Bât S, amphi MS001 (Toulouse School of Economics)

Bât S, amphi MS001

Toulouse School of Economics

Manufacture des Tabacs, 21, Allée de Brienne 31015 Toulouse Cedex 6 FRANCE

Orateur

Xavier Bry (Inst. Montpellier)

Description

L'estimation des modèles linéaires généralisés en grande dimension nécessite leur régularisation. Pour que le prédicteur linéaire soit interprétable, il est en outre indispensable que celui-ci soit relié à un nombre réduit de dimensions d'interprétation simple. La pénalisation LASSO permet certes de réaliser régularisation et réduction dimensionnelle, les dimensions trouvées étant les variables sélectionnées. Mais LASSO est instable lorsque les colinéarités sont nombreuses parmi les variables explicatives, et risque de sélectionner, à la place d'une variable véritablement explicative, une variable qui lui est très corrélée. A contrario, nous proposons de conserver a priori toutes les variables explicatives, mais de chercher un nombre restreint de dimensions, appelées composantes supervisées, qui soient à la fois très liées aux variables explicatives (donc facilement interprétables) et fortement prédictives des réponses. La recherche de ces dimensions permet également de régulariser le modèle. La méthodologie des composantes supervisées étend, en l'assouplissant, la régression PLS à tous les modèles linéaires généralisés. Les intervalles de confiance bootstrap sur les coefficients permettent une sélection a posteriori des variables participant à la prédiction. Nous présentons l'adaptation de cette méthodologie aux GLMM et au modèle de Cox, en montrant qu'elle constitue un pont pratique entre exploration et modélisation des données.

Co-auteurs

Catherine Trottier (Inst. Montpellier) Jocelyn Chauvet (Inst. Montpellier)

Documents de présentation

Aucun document.