Análisis Comparativo de Algoritmos de Aprendizaje por Refuerzo Profundo para Maniobras de Transición de Hover a Crucero de un Vehículo Aéreo No Tripulado de Rotor Inclinado

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Análisis Comparativo de Algoritmos de Aprendizaje por Refuerzo Profundo para Maniobras de Transición de Hover a Crucero de un Vehículo Aéreo No Tripulado de Rotor Inclinado

Autores: Akhtar, Mishma; Maqsood, Adnan

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Análisis Comparativo de Algoritmos de Aprendizaje por Refuerzo Profundo para Maniobras de Transición de Hover a Crucero de un Vehículo Aéreo No Tripulado de Rotor Inclinado

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Optimización de trayectorias

Inteligencia artificial

UAVs

Algoritmos de aprendizaje por refuerzo

Tricóptero de rotor inclinado

DRL

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones

El trabajo sobre la optimización de trayectorias está evolucionando rápidamente debido a la introducción de algoritmos basados en inteligencia artificial (IA). Se espera que los UAV pequeños ejecuten maniobras versátiles en entornos desconocidos. Estudios previos sobre estos UAV se han centrado en el diseño de controladores convencionales, modelado y rendimiento, lo que ha planteado varios desafíos. Sin embargo, un área menos explorada es el uso de algoritmos de aprendizaje por refuerzo para realizar maniobras ágiles como la transición de un vuelo en suspensión a un vuelo de crucero. Este artículo presenta un marco unificado para el desarrollo y la optimización de un UAV tricóptero de rotor inclinado capaz de realizar despegues y aterrizajes verticales (VTOL) y transiciones eficientes de vuelo en suspensión a vuelo de crucero. El UAV está equipado con un sistema de control basado en aprendizaje por refuerzo, utilizando específicamente algoritmos como Deep Deterministic Policy Gradient (DDPG), Trust Region Policy Optimization (TRPO) y Proximal Policy Optimization (PPO). A través de simulaciones extensas, el estudio identifica a PPO como el algoritmo más robusto, logrando un rendimiento superior en términos de estabilidad y convergencia en comparación con DDPG y TRPO. Los hallazgos demuestran la eficacia del DRL para aprovechar la dinámica única de los UAV de rotor inclinado y muestran una mejora significativa en la precisión de maniobra y la adaptabilidad del control. Este estudio demuestra el potencial de los algoritmos de aprendizaje por refuerzo para avanzar en las operaciones autónomas de UAV al cerrar la brecha entre el modelado dinámico y las estrategias de control inteligente, subrayando los beneficios prácticos del DRL en la robótica aérea.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro