Redes neuronales alternantes acopladas para resolver juegos de campo medio multidimensionales de alta dimensión en múltiples poblaciones
Autores: Wang, Guofang; Fang, Jing; Jiang, Lulu; Yao, Wang; Li, Ning
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Redes neuronales alternantes acopladas para resolver juegos de campo medio multidimensionales de alta dimensión en múltiples poblaciones
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Juego de campo medio de múltiples poblaciones
Juegos de campo medio
Modelo de múltiples agentes
Problema MFG estocástico de alta dimensionalidad
CA-Net
Red generativa adversaria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
El juego de campo medio de múltiples poblaciones es una subclase crítica de los juegos de campo medio (MFGs). Es un modelo teóricamente factible de múltiples agentes para simular y analizar el juego entre múltiples poblaciones heterogéneas de agentes masivos que interactúan. Debido a los factores de complejidad del juego, desastre de dimensionalidad y perturbaciones que deben tenerse en cuenta simultáneamente para resolver el problema MFG estocástico de alta dimensionalidad de múltiples poblaciones, lo cual es un gran desafío. Presentamos CA-Net, un enfoque de red neuronal alternante acoplada para resolver de manera factible los MFG de alta dimensionalidad de múltiples poblaciones. Primero, proporcionamos un marco de modelado universal para sistemas de juego de agentes múltiples heterogéneos a gran escala, que se expresa estrictamente como un problema MFG de múltiples poblaciones. A continuación, generalizamos la estructura primal-dual variacional potencial que exhiben los MFG, luego formulamos el problema MFG de múltiples poblaciones como un problema de punto de silla cóncavo-convexo. Por último, diseñamos una red generativa adversarial (GAN) con múltiples generadores y múltiples discriminadores: la red de resolución, que parametriza las funciones de valor y las funciones de densidad de múltiples poblaciones mediante dos conjuntos de redes neuronales, respectivamente. En experimentos numéricos de planificación de trayectorias de cuadricópteros de múltiples grupos, los resultados de convergencia de los residuos de HJB, control y velocidad promedio muestran la eficacia del algoritmo CA-Net, y la comparación con métodos de referencia - juego de grupo, HJB-NN, Lax-Friedrichs, ML y APAC-Net - muestra el progresismo de nuestro método de solución.
Descripción
El juego de campo medio de múltiples poblaciones es una subclase crítica de los juegos de campo medio (MFGs). Es un modelo teóricamente factible de múltiples agentes para simular y analizar el juego entre múltiples poblaciones heterogéneas de agentes masivos que interactúan. Debido a los factores de complejidad del juego, desastre de dimensionalidad y perturbaciones que deben tenerse en cuenta simultáneamente para resolver el problema MFG estocástico de alta dimensionalidad de múltiples poblaciones, lo cual es un gran desafío. Presentamos CA-Net, un enfoque de red neuronal alternante acoplada para resolver de manera factible los MFG de alta dimensionalidad de múltiples poblaciones. Primero, proporcionamos un marco de modelado universal para sistemas de juego de agentes múltiples heterogéneos a gran escala, que se expresa estrictamente como un problema MFG de múltiples poblaciones. A continuación, generalizamos la estructura primal-dual variacional potencial que exhiben los MFG, luego formulamos el problema MFG de múltiples poblaciones como un problema de punto de silla cóncavo-convexo. Por último, diseñamos una red generativa adversarial (GAN) con múltiples generadores y múltiples discriminadores: la red de resolución, que parametriza las funciones de valor y las funciones de densidad de múltiples poblaciones mediante dos conjuntos de redes neuronales, respectivamente. En experimentos numéricos de planificación de trayectorias de cuadricópteros de múltiples grupos, los resultados de convergencia de los residuos de HJB, control y velocidad promedio muestran la eficacia del algoritmo CA-Net, y la comparación con métodos de referencia - juego de grupo, HJB-NN, Lax-Friedrichs, ML y APAC-Net - muestra el progresismo de nuestro método de solución.