Un Algoritmo de Control Jerárquico para un Juego de Persecución-Evasión Basado en Aprendizaje Fuzzy Actor-Crítico y Control Predictivo de Modelos
Autores: Hu, Penglin; Zhao, Chunhui; Pan, Quan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un Algoritmo de Control Jerárquico para un Juego de Persecución-Evasión Basado en Aprendizaje Fuzzy Actor-Crítico y Control Predictivo de Modelos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Aprendizaje de actor-crítico difuso
Control predictivo de modelos
Juego de persecución y evasión
Cuadricópteros
Marco jerárquico
Entradas de referencia en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este artículo, adoptamos los algoritmos de aprendizaje de actor-crítico difuso (FACL) y control predictivo de modelo (MPC) para resolver el juego de persecución-esquiva (PEG) de los quadrotors. FACL se utiliza para la percepción, la toma de decisiones y la predicción de las trayectorias de los agentes, mientras que MPC se utiliza para abordar el control de vuelo y la optimización de objetivos de los quadrotors. Específicamente, basado en la información del oponente, el agente obtiene su propia estrategia de juego utilizando el algoritmo FACL. Basado en la entrada de referencia del algoritmo FACL, se utiliza el algoritmo MPC para desarrollar controladores de altitud, traducción y actitud para el quadrotor. En el marco jerárquico propuesto, el algoritmo FACL proporciona entradas de referencia en tiempo real para el controlador MPC, mejorando la robustez del control del quadrotor. Los resultados de simulación y experimentales muestran que el algoritmo de control jerárquico propuesto realiza efectivamente el PEG de los quadrotors.
Descripción
En este artículo, adoptamos los algoritmos de aprendizaje de actor-crítico difuso (FACL) y control predictivo de modelo (MPC) para resolver el juego de persecución-esquiva (PEG) de los quadrotors. FACL se utiliza para la percepción, la toma de decisiones y la predicción de las trayectorias de los agentes, mientras que MPC se utiliza para abordar el control de vuelo y la optimización de objetivos de los quadrotors. Específicamente, basado en la información del oponente, el agente obtiene su propia estrategia de juego utilizando el algoritmo FACL. Basado en la entrada de referencia del algoritmo FACL, se utiliza el algoritmo MPC para desarrollar controladores de altitud, traducción y actitud para el quadrotor. En el marco jerárquico propuesto, el algoritmo FACL proporciona entradas de referencia en tiempo real para el controlador MPC, mejorando la robustez del control del quadrotor. Los resultados de simulación y experimentales muestran que el algoritmo de control jerárquico propuesto realiza efectivamente el PEG de los quadrotors.