Méthodes de réseaux de neurones pour le contrôle optimal en grande dimension et les jeux à champ moyen
par
XR203
XLIM
Les problèmes de contrôle optimal et de jeux à champ moyen (MFG) en grande dimension posent un défi majeur en raison de la malédiction de la dimensionnalité, qui rend les méthodes classiques (différences finies, éléments finis) inapplicables dès que la dimension dépasse 4 ou 5. Dans cet exposé, nous présentons une famille de méthodes basées sur les réseaux de neurones pour résoudre ces problèmes. Nous introduisons d'abord deux approches : MFDGM, qui minimise directement le résidu des EDP couplées du système MFG et permet de traiter des Hamiltoniens non séparables, et Deep Policy Iteration (DPI), qui combine l'itération de politique avec des réseaux de neurones pour offrir un critère de convergence rigoureux. Nous présentons ensuite notre contribution principale, la méthode IGT (Initialization–Generation–Training), qui exploite le lien entre l'équation de Hamilton–Jacobi–Bellman et le Principe du Maximum de Pontryaguine pour générer des données d'entraînement exactes. Cette approche hybride, mêlant apprentissage supervisé et apprentissage informé par la physique, atteint des bonnes précisions. Nous montrons enfin comment étendre IGT aux jeux à champ moyen via un algorithme de fictitious play couplé à un réseau générateur pour l'équation de continuité, et nous illustrons nos résultats sur des benchmarks analytiques ainsi que sur des problèmes d'évitement d'obstacles.