Escalable learning para juegos de campo medio espacio-temporales utilizando operador neural informado por física
Autores: Liu, Shuo; Chen, Xu; Di, Xuan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Escalable learning para juegos de campo medio espacio-temporales utilizando operador neural informado por física
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Propone un marco de aprendizaje escalable
Juegos de campo medio
Ecuaciones diferenciales parciales hacia adelante-atrás
Operador neural informado por física
Conducción autónoma
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Este documento propone un marco de aprendizaje escalable para resolver un sistema de ecuaciones en derivadas parciales (EDP) acopladas hacia adelante y hacia atrás que surgen de los juegos de campo medio (MFG). El sistema MFG incorpora una EDP hacia adelante para modelar la propagación de la dinámica de la población y una EDP hacia atrás para el control óptimo de un agente representativo. El trabajo existente se centra principalmente en resolver el equilibrio del juego de campo medio (MFE) del sistema MFG cuando se tienen condiciones de contorno fijas, incluido el estado inicial de la población y el costo terminal. Para obtener MFE de manera eficiente, especialmente cuando la densidad inicial de la población y el costo terminal varían, utilizamos un operador neural informado por la física (PINO) para abordar las EDP hacia adelante y hacia atrás. Se ha diseñado un algoritmo de aprendizaje y se ha evaluado su rendimiento en un dominio de aplicación, que es el control de la velocidad de conducción autónoma. Los experimentos numéricos muestran que nuestro método puede obtener el MFE con precisión cuando se tienen diferentes distribuciones iniciales de vehículos. El PINO exhibe tanto eficiencia de memoria como capacidades de generalización en comparación con las redes neuronales informadas por la física (PINNs).
Descripción
Este documento propone un marco de aprendizaje escalable para resolver un sistema de ecuaciones en derivadas parciales (EDP) acopladas hacia adelante y hacia atrás que surgen de los juegos de campo medio (MFG). El sistema MFG incorpora una EDP hacia adelante para modelar la propagación de la dinámica de la población y una EDP hacia atrás para el control óptimo de un agente representativo. El trabajo existente se centra principalmente en resolver el equilibrio del juego de campo medio (MFE) del sistema MFG cuando se tienen condiciones de contorno fijas, incluido el estado inicial de la población y el costo terminal. Para obtener MFE de manera eficiente, especialmente cuando la densidad inicial de la población y el costo terminal varían, utilizamos un operador neural informado por la física (PINO) para abordar las EDP hacia adelante y hacia atrás. Se ha diseñado un algoritmo de aprendizaje y se ha evaluado su rendimiento en un dominio de aplicación, que es el control de la velocidad de conducción autónoma. Los experimentos numéricos muestran que nuestro método puede obtener el MFE con precisión cuando se tienen diferentes distribuciones iniciales de vehículos. El PINO exhibe tanto eficiencia de memoria como capacidades de generalización en comparación con las redes neuronales informadas por la física (PINNs).