Soutenances

Modèles contrefactuels pour un apprentissage machine juste et explicable : une approche par transport de masse

par M. Lucas De Lara (Institut de Mathématiques de Toulouse)

Europe/Paris
Auditorium Jacques Herbrand (Institut de Recherche en Informatique de Toulouse)

Auditorium Jacques Herbrand

Institut de Recherche en Informatique de Toulouse

118 route de Narbonne 31062 Toulouse Cedex 9
Description

La propagation de règles de décision automatiques basées sur l'apprentissage machine a soulevé de graves préoccupations éthiques en raison de leur manque d'interprétabilité et de leur automatisation des biais discriminatoires humains. Ce problème a donné naissance à la recherche en l'intelligence artificielle digne de confiance, qui traite du développement d'algorithmes d'apprentissage automatique équitables et explicables. Cette thèse contribue à cette initiative en étudiant l'équité et l'explicabilité à travers le prisme du raisonnement contrefactuel : une modalité consacrée à des requêtes telles que "Si elle avait été un homme, lui aurait-on accordé le prêt?". Le premier chapitre sert d'introduction aux méthodologies contrefactuelles dans l'apprentissage automatique et clarifie des idées reçues courantes. Le deuxième chapitre développe les fondements théoriques de la mise en œuvre de ce raisonnement à l'aide de méthodes de transport de masse telles que le transport optimal et l'appariement difféomorphique. Contrairement aux méthodes standards, cette approche renvoie des énoncés contrefactuels qui sont à la fois implémentable d'un point de vue informatique et réalistes d'un point de vue sémantique, ce qui permet un déploiement plus large des méthodologies contrefactuelles pour l'équité et l'explicabilité. Les troisième et quatrième chapitres sont autonomes mais motivés par les aspects pratiques de ce point de vue par transport de masse du raisonnement contrefactuel : ils traitent de l'estimation statistique des modèles de transport. Le troisième chapitre présente un estimateur GAN d'applications de transport optimales Lipschitz accompagné de garanties statistiques uniques pour une telle approximation basée sur des réseaux de neurones. Le quatrième chapitre traite de l'appariement difféomorphique, en fondant théoriquement et numériquement le transport de masse difféomorphique piloté par les divergences de Sinkhorn (des divergences de transport optimal entropique).