Un Marco de Sistema de Recomendación para la Decisión de Maniobra Autónoma de Vehículos Aéreos No Tripulados
Autores: Hao, Qinzhi; Jing, Tengyu; Sun, Yao; Yang, Zhuolin; Zhang, Jiali; Wang, Jiapeng; Wang, Wei
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un Marco de Sistema de Recomendación para la Decisión de Maniobra Autónoma de Vehículos Aéreos No Tripulados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Sistemas de recomendación autónomos
Maniobra de UAV
Dinámica de seis grados de libertad
Sistema de recomendación de aprendizaje
Algoritmo PER-DDPG
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La toma de decisiones de maniobra autónoma en vehículos aéreos no tripulados (VANT) es crucial para ejecutar misiones complejas que involucran tanto operaciones individuales como en enjambre de VANT. Aprovechando el exitoso despliegue de sistemas de recomendación en el comercio y aplicaciones en línea, este documento pionero presenta un marco diseñado para las decisiones de maniobra de VANT. Este enfoque novedoso utiliza sistemas de recomendación para mejorar la toma de decisiones en las maniobras de VANT. Nuestro marco incorpora un modelo dinámico integral de seis grados de libertad que integra efectos gravitacionales y define criterios de éxito de la misión. Desarrollamos un sistema de recomendación de aprendizaje integrado capaz de simular diversos escenarios de misión, facilitando la adquisición de estrategias óptimas a partir de una combinación de la entrada de expertos humanos y salidas algorítmicas. El sistema admite amplias capacidades de simulación, incluidos varios modos de control (manual, autónomo e híbrido) y acciones de maniobra tanto continuas como discretas. A través de rigurosas pruebas basadas en computadora, validamos la efectividad de los algoritmos de recomendación establecidos dentro de nuestro marco. Notablemente, el algoritmo de gradiente de política determinista profunda con repetición de experiencia priorizada (PER-DDPG), que emplea recompensas densas y acciones continuas, demostró un rendimiento superior, logrando una tasa de éxito del 69% en escenarios confrontacionales contra un algoritmo experto versátil después de 1000 iteraciones de entrenamiento, marcando una reducción del 80% en el tiempo de entrenamiento en comparación con los métodos convencionales de aprendizaje por refuerzo. Este marco no solo simplifica la comparación de diferentes algoritmos de maniobra, sino que también promueve la integración de conocimientos expertos de múltiples fuentes y algoritmos sofisticados, allanando el camino para aplicaciones avanzadas de VANT en entornos operativos complejos.
Descripción
La toma de decisiones de maniobra autónoma en vehículos aéreos no tripulados (VANT) es crucial para ejecutar misiones complejas que involucran tanto operaciones individuales como en enjambre de VANT. Aprovechando el exitoso despliegue de sistemas de recomendación en el comercio y aplicaciones en línea, este documento pionero presenta un marco diseñado para las decisiones de maniobra de VANT. Este enfoque novedoso utiliza sistemas de recomendación para mejorar la toma de decisiones en las maniobras de VANT. Nuestro marco incorpora un modelo dinámico integral de seis grados de libertad que integra efectos gravitacionales y define criterios de éxito de la misión. Desarrollamos un sistema de recomendación de aprendizaje integrado capaz de simular diversos escenarios de misión, facilitando la adquisición de estrategias óptimas a partir de una combinación de la entrada de expertos humanos y salidas algorítmicas. El sistema admite amplias capacidades de simulación, incluidos varios modos de control (manual, autónomo e híbrido) y acciones de maniobra tanto continuas como discretas. A través de rigurosas pruebas basadas en computadora, validamos la efectividad de los algoritmos de recomendación establecidos dentro de nuestro marco. Notablemente, el algoritmo de gradiente de política determinista profunda con repetición de experiencia priorizada (PER-DDPG), que emplea recompensas densas y acciones continuas, demostró un rendimiento superior, logrando una tasa de éxito del 69% en escenarios confrontacionales contra un algoritmo experto versátil después de 1000 iteraciones de entrenamiento, marcando una reducción del 80% en el tiempo de entrenamiento en comparación con los métodos convencionales de aprendizaje por refuerzo. Este marco no solo simplifica la comparación de diferentes algoritmos de maniobra, sino que también promueve la integración de conocimientos expertos de múltiples fuentes y algoritmos sofisticados, allanando el camino para aplicaciones avanzadas de VANT en entornos operativos complejos.