Aprendizaje por Refuerzo Profundo Basado en Visión de la Política de Aterrizaje Colaborativa UAV-UGV Usando un Currículo Automático
Autores: Wang, Chang; Wang, Jiaqing; Wei, Changyun; Zhu, Yi; Yin, Dong; Li, Jie
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje por Refuerzo Profundo Basado en Visión de la Política de Aterrizaje Colaborativa UAV-UGV Usando un Currículo Automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Aterrizaje autónomo
Quadrotor
UAV
UGV
Sistema de visión
Red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El aterrizaje autónomo colaborativo de un vehículo aéreo no tripulado (UAV) quadrotor sobre un vehículo terrestre no tripulado (UGV) en movimiento presenta desafíos debido a la necesidad de un seguimiento preciso en tiempo real del UGV y el ajuste de la política de aterrizaje. Para abordar este desafío, proponemos un marco de aprendizaje progresivo para generar una política de aterrizaje óptima basada en visión sin necesidad de comunicación entre el UAV y el UGV. Primero, proponemos el Sistema de Visión de Aterrizaje (LVS) para ofrecer una localización rápida y estimación de la pose del UGV. Luego, diseñamos un enfoque de Aprendizaje Automático de Currículo (ACL) para aprender las tareas de aterrizaje bajo diferentes condiciones de movimientos del UGV e interferencia del viento. Específicamente, introducimos un discriminador de dificultad basado en redes neuronales para programar las tareas de aterrizaje de acuerdo con sus niveles de dificultad. Nuestro método logra una tasa de éxito y precisión de aterrizaje más alta en comparación con el algoritmo de aprendizaje por refuerzo TD3 de última generación.
Descripción
El aterrizaje autónomo colaborativo de un vehículo aéreo no tripulado (UAV) quadrotor sobre un vehículo terrestre no tripulado (UGV) en movimiento presenta desafíos debido a la necesidad de un seguimiento preciso en tiempo real del UGV y el ajuste de la política de aterrizaje. Para abordar este desafío, proponemos un marco de aprendizaje progresivo para generar una política de aterrizaje óptima basada en visión sin necesidad de comunicación entre el UAV y el UGV. Primero, proponemos el Sistema de Visión de Aterrizaje (LVS) para ofrecer una localización rápida y estimación de la pose del UGV. Luego, diseñamos un enfoque de Aprendizaje Automático de Currículo (ACL) para aprender las tareas de aterrizaje bajo diferentes condiciones de movimientos del UGV e interferencia del viento. Específicamente, introducimos un discriminador de dificultad basado en redes neuronales para programar las tareas de aterrizaje de acuerdo con sus niveles de dificultad. Nuestro método logra una tasa de éxito y precisión de aterrizaje más alta en comparación con el algoritmo de aprendizaje por refuerzo TD3 de última generación.