Marco de Aprendizaje por Refuerzo Eficiente en Datos para Vuelo Autónomo Basado en Datos de Vuelo del Mundo Real
Autores: Lee, Uicheon; Lee, Seonah; Kim, Kyonghoon
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Marco de Aprendizaje por Refuerzo Eficiente en Datos para Vuelo Autónomo Basado en Datos de Vuelo del Mundo Real
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vuelo autónomo
Aprendizaje por refuerzo
Red Generativa Antagónica
Repetición de Experiencia en Perspectiva
Basado en modelos
Control de cuadricópteros
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Recientemente, el vuelo autónomo ha surgido como una tecnología clave en los sectores aeroespacial y de defensa; sin embargo, los sistemas de vuelo autónomo basados en código tradicionales enfrentan limitaciones en entornos complejos. Aunque el aprendizaje por refuerzo ofrece una alternativa, su aplicación práctica en entornos del mundo real se ve obstaculizada por los sustanciales requisitos de datos. En este estudio, desarrollamos un marco que integra una Red Generativa Antagónica (GAN) y Repetición de Experiencia en Perspectiva (HER) en el aprendizaje por refuerzo basado en modelos para mejorar la eficiencia y precisión de los datos. Comparamos el marco propuesto con algoritmos existentes en el control de cuadricópteros reales. En el experimento comparativo, demostramos una mejora de hasta el 70.59% en la velocidad de aprendizaje, destacando claramente el impacto del modelo ambiental. Hasta donde sabemos, este estudio es el primero en el que se combinan una GAN y HER con el aprendizaje por refuerzo basado en modelos, y se espera que contribuya significativamente a la aplicación práctica del aprendizaje por refuerzo en el vuelo autónomo.
Descripción
Recientemente, el vuelo autónomo ha surgido como una tecnología clave en los sectores aeroespacial y de defensa; sin embargo, los sistemas de vuelo autónomo basados en código tradicionales enfrentan limitaciones en entornos complejos. Aunque el aprendizaje por refuerzo ofrece una alternativa, su aplicación práctica en entornos del mundo real se ve obstaculizada por los sustanciales requisitos de datos. En este estudio, desarrollamos un marco que integra una Red Generativa Antagónica (GAN) y Repetición de Experiencia en Perspectiva (HER) en el aprendizaje por refuerzo basado en modelos para mejorar la eficiencia y precisión de los datos. Comparamos el marco propuesto con algoritmos existentes en el control de cuadricópteros reales. En el experimento comparativo, demostramos una mejora de hasta el 70.59% en la velocidad de aprendizaje, destacando claramente el impacto del modelo ambiental. Hasta donde sabemos, este estudio es el primero en el que se combinan una GAN y HER con el aprendizaje por refuerzo basado en modelos, y se espera que contribuya significativamente a la aplicación práctica del aprendizaje por refuerzo en el vuelo autónomo.