Un Controlador de Formación de Maniobras de Doble Aeronave para MAV/UAV Basado en el Agente Inteligente Híbrido
Autores: Zhao, Luodi; Liu, Yemo; Peng, Qiangqiang; Zhao, Long
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un Controlador de Formación de Maniobras de Doble Aeronave para MAV/UAV Basado en el Agente Inteligente Híbrido
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Propone
Controlador de agente inteligente híbrido
Vehículos aéreos tripulados
Vehículos aéreos no tripulados
Formación
Estrategia de control líder-seguidor
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento propone un controlador de agente inteligente híbrido (HIAC) para vehículos aéreos tripulados (MAV) / vehículos aéreos no tripulados (UAV) en formación bajo la estrategia de control líder-seguidor. Basado en el modelo dinámico de alta fidelidad de tres grados de libertad (DOF) del UAV, este método desacopló sistemas de múltiples entradas y múltiples salidas (MIMO) en múltiples sistemas de entrada única y salida única (SISO). Luego, combinó de manera innovadora el gradiente de política determinista profundo (DDPG) y la red Q profunda doble (DDQN) para construir un modelo de agente de aprendizaje por refuerzo híbrido, que se utilizó para generar comandos de estado deseados a bordo. Finalmente, adoptamos la ley de control de inversión dinámica y el filtro de retardo de primer orden para mejorar el proceso de control de vuelo real. Bajo las condiciones de trabajo de una maniobra de sobrecarga grande en forma de S continua para el MAV, las simulaciones verificaron que el UAV puede lograr un seguimiento preciso de la trayectoria compleja del MAV. En comparación con el regulador cuadrático lineal (LQR) tradicional y el DDPG, el HIAC tiene mejor eficiencia y precisión de control.
Descripción
Este documento propone un controlador de agente inteligente híbrido (HIAC) para vehículos aéreos tripulados (MAV) / vehículos aéreos no tripulados (UAV) en formación bajo la estrategia de control líder-seguidor. Basado en el modelo dinámico de alta fidelidad de tres grados de libertad (DOF) del UAV, este método desacopló sistemas de múltiples entradas y múltiples salidas (MIMO) en múltiples sistemas de entrada única y salida única (SISO). Luego, combinó de manera innovadora el gradiente de política determinista profundo (DDPG) y la red Q profunda doble (DDQN) para construir un modelo de agente de aprendizaje por refuerzo híbrido, que se utilizó para generar comandos de estado deseados a bordo. Finalmente, adoptamos la ley de control de inversión dinámica y el filtro de retardo de primer orden para mejorar el proceso de control de vuelo real. Bajo las condiciones de trabajo de una maniobra de sobrecarga grande en forma de S continua para el MAV, las simulaciones verificaron que el UAV puede lograr un seguimiento preciso de la trayectoria compleja del MAV. En comparación con el regulador cuadrático lineal (LQR) tradicional y el DDPG, el HIAC tiene mejor eficiencia y precisión de control.