logo móvil
Contáctanos

Un Marco de Sistema de Recomendación para la Decisión de Maniobra Autónoma de Vehículos Aéreos No Tripulados

Autores: Hao, Qinzhi; Jing, Tengyu; Sun, Yao; Yang, Zhuolin; Zhang, Jiali; Wang, Jiapeng; Wang, Wei

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Un Marco de Sistema de Recomendación para la Decisión de Maniobra Autónoma de Vehículos Aéreos No Tripulados


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Sistemas de recomendación autónomos
Maniobra de UAV
Dinámica de seis grados de libertad
Sistema de recomendación de aprendizaje
Algoritmo PER-DDPG

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La toma de decisiones de maniobra autónoma en vehículos aéreos no tripulados (VANT) es crucial para ejecutar misiones complejas que involucran tanto operaciones individuales como en enjambre de VANT. Aprovechando el exitoso despliegue de sistemas de recomendación en el comercio y aplicaciones en línea, este documento pionero presenta un marco diseñado para las decisiones de maniobra de VANT. Este enfoque novedoso utiliza sistemas de recomendación para mejorar la toma de decisiones en las maniobras de VANT. Nuestro marco incorpora un modelo dinámico integral de seis grados de libertad que integra efectos gravitacionales y define criterios de éxito de la misión. Desarrollamos un sistema de recomendación de aprendizaje integrado capaz de simular diversos escenarios de misión, facilitando la adquisición de estrategias óptimas a partir de una combinación de la entrada de expertos humanos y salidas algorítmicas. El sistema admite amplias capacidades de simulación, incluidos varios modos de control (manual, autónomo e híbrido) y acciones de maniobra tanto continuas como discretas. A través de rigurosas pruebas basadas en computadora, validamos la efectividad de los algoritmos de recomendación establecidos dentro de nuestro marco. Notablemente, el algoritmo de gradiente de política determinista profunda con repetición de experiencia priorizada (PER-DDPG), que emplea recompensas densas y acciones continuas, demostró un rendimiento superior, logrando una tasa de éxito del 69% en escenarios confrontacionales contra un algoritmo experto versátil después de 1000 iteraciones de entrenamiento, marcando una reducción del 80% en el tiempo de entrenamiento en comparación con los métodos convencionales de aprendizaje por refuerzo. Este marco no solo simplifica la comparación de diferentes algoritmos de maniobra, sino que también promueve la integración de conocimientos expertos de múltiples fuentes y algoritmos sofisticados, allanando el camino para aplicaciones avanzadas de VANT en entornos operativos complejos.

Otros recursos que podrían interesarte

Temas Virtualpro