Aprendizaje por refuerzo modular para el control de vuelo autónomo de UAV
Autores: Choi, Jongkwan; Kim, Hyeon Min; Hwang, Ha Jun; Kim, Yong-Duk; Kim, Chang Ouk
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje por refuerzo modular para el control de vuelo autónomo de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Investigación
UAVs
Vuelo autónomo
Aprendizaje por refuerzo
Aprendizaje modular
Aprendizaje por currículos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Recientemente, la investigación sobre vehículos aéreos no tripulados (VANT) ha aumentado significativamente. Los VANT no requieren pilotos para su operación, y deben poseer capacidades de vuelo autónomo para garantizar que puedan ser controlados sin un piloto humano en tierra. Estudios anteriores se han centrado principalmente en métodos basados en reglas, que requieren personal especializado para crear reglas. El aprendizaje por refuerzo se ha aplicado a la investigación sobre el vuelo autónomo de VANT; sin embargo, no incluye entornos de seis grados de libertad (6-DOF) y carece de aplicación realista, lo que resulta en dificultades para realizar tareas complejas. Este estudio propone un método de aprendizaje eficiente al conectar dos métodos de maniobra diferentes utilizando aprendizaje modular para vuelos autónomos de VANT. El método propuesto divide tareas complejas en tareas más simples, las aprende individualmente y luego las conecta para lograr un aprendizaje más rápido al transferir información de un módulo a otro. Además, se aplicó el concepto de aprendizaje por currículos, y el nivel de dificultad de las tareas individuales se incrementó gradualmente, lo que fortaleció la estabilidad del aprendizaje. En conclusión, se utilizaron métodos de aprendizaje modular y aprendizaje por currículos para demostrar que los VANT pueden realizar efectivamente tareas complejas en un entorno realista de 6-DOF.
Descripción
Recientemente, la investigación sobre vehículos aéreos no tripulados (VANT) ha aumentado significativamente. Los VANT no requieren pilotos para su operación, y deben poseer capacidades de vuelo autónomo para garantizar que puedan ser controlados sin un piloto humano en tierra. Estudios anteriores se han centrado principalmente en métodos basados en reglas, que requieren personal especializado para crear reglas. El aprendizaje por refuerzo se ha aplicado a la investigación sobre el vuelo autónomo de VANT; sin embargo, no incluye entornos de seis grados de libertad (6-DOF) y carece de aplicación realista, lo que resulta en dificultades para realizar tareas complejas. Este estudio propone un método de aprendizaje eficiente al conectar dos métodos de maniobra diferentes utilizando aprendizaje modular para vuelos autónomos de VANT. El método propuesto divide tareas complejas en tareas más simples, las aprende individualmente y luego las conecta para lograr un aprendizaje más rápido al transferir información de un módulo a otro. Además, se aplicó el concepto de aprendizaje por currículos, y el nivel de dificultad de las tareas individuales se incrementó gradualmente, lo que fortaleció la estabilidad del aprendizaje. En conclusión, se utilizaron métodos de aprendizaje modular y aprendizaje por currículos para demostrar que los VANT pueden realizar efectivamente tareas complejas en un entorno realista de 6-DOF.