Toma de Decisiones de Forma Autónoma de Aeronaves Morphing con Aprendizaje por Refuerzo Mejorado
Autores: Jiang, Weilai; Zheng, Chenghong; Hou, Delong; Wu, Kangsheng; Wang, Yaonan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Toma de Decisiones de Forma Autónoma de Aeronaves Morphing con Aprendizaje por Refuerzo Mejorado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Aeronaves autónomas
Aeronaves que se transforman
Toma de decisiones
Algoritmo
DDPG
LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Se estudia en este artículo el problema de toma de decisiones de forma autónoma de una aeronave morfante (MA) con una envergadura y ángulo de barrido variables. Considerando la continuidad del espacio de estados y del espacio de acciones, se diseña un marco de algoritmo de toma de decisiones autónomas más práctico para la MA basado en el algoritmo de gradiente de política determinista profunda (DDPG). Además, se propone el algoritmo DDPG con un clasificador de tareas (DDPGwTC) en combinación con la red de memoria a corto y largo plazo (LSTM) para mejorar la velocidad de convergencia del algoritmo. Los resultados de la simulación muestran que el algoritmo de toma de decisiones de forma basado en DDPGwTC permite a la MA adoptar la estrategia de morfado óptima en diferentes entornos de tarea con mayor autonomía y adaptabilidad ambiental, lo que verifica la efectividad del algoritmo propuesto.
Descripción
Se estudia en este artículo el problema de toma de decisiones de forma autónoma de una aeronave morfante (MA) con una envergadura y ángulo de barrido variables. Considerando la continuidad del espacio de estados y del espacio de acciones, se diseña un marco de algoritmo de toma de decisiones autónomas más práctico para la MA basado en el algoritmo de gradiente de política determinista profunda (DDPG). Además, se propone el algoritmo DDPG con un clasificador de tareas (DDPGwTC) en combinación con la red de memoria a corto y largo plazo (LSTM) para mejorar la velocidad de convergencia del algoritmo. Los resultados de la simulación muestran que el algoritmo de toma de decisiones de forma basado en DDPGwTC permite a la MA adoptar la estrategia de morfado óptima en diferentes entornos de tarea con mayor autonomía y adaptabilidad ambiental, lo que verifica la efectividad del algoritmo propuesto.