Un UAV Totalmente Controlable Usando Aprendizaje por Currículo y Aprendizaje por Refuerzo Condicionado por Objetivos: De Misiones Directas a Misiones de Viaje Redondo
Autores: Kim, Hyeonmin; Choi, Jongkwan; Do, Hyungrok; Lee, Gyeong Taek
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un UAV Totalmente Controlable Usando Aprendizaje por Currículo y Aprendizaje por Refuerzo Condicionado por Objetivos: De Misiones Directas a Misiones de Viaje Redondo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículo aéreo no tripulado
Planificación de rutas
Evitación de obstáculos
Alcance eficiente de objetivos
Aprendizaje por refuerzo
Navegación de ida y vuelta
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El enfoque de la planificación de rutas de vehículos aéreos no tripulados (UAV) incluye tareas desafiantes como la evasión de obstáculos y el alcance eficiente de objetivos en entornos complejos. Basándonos en estos desafíos fundamentales, existe una necesidad adicional de agentes que puedan manejar diversas misiones, como la navegación de ida y vuelta, sin requerir reentrenamiento para cada tarea específica. En nuestro estudio, presentamos un método de planificación de rutas utilizando aprendizaje por refuerzo (RL) para un agente UAV completamente controlable. Combinamos RL condicionado por objetivos y aprendizaje por currículos para permitir que los agentes dominen progresivamente misiones cada vez más complejas, desde el alcance de un solo objetivo hasta la navegación de ida y vuelta. Nuestros resultados experimentales demuestran que el agente entrenado completó con éxito el 95% de las tareas simples de alcance de objetivos y el 70% de las misiones complejas de ida y vuelta. El agente mantuvo un rendimiento estable incluso con múltiples subobjetivos, logrando más del 75% de tasa de éxito en misiones de tres subobjetivos, lo que indica un fuerte potencial para aplicaciones prácticas en la planificación de rutas de UAV.
Descripción
El enfoque de la planificación de rutas de vehículos aéreos no tripulados (UAV) incluye tareas desafiantes como la evasión de obstáculos y el alcance eficiente de objetivos en entornos complejos. Basándonos en estos desafíos fundamentales, existe una necesidad adicional de agentes que puedan manejar diversas misiones, como la navegación de ida y vuelta, sin requerir reentrenamiento para cada tarea específica. En nuestro estudio, presentamos un método de planificación de rutas utilizando aprendizaje por refuerzo (RL) para un agente UAV completamente controlable. Combinamos RL condicionado por objetivos y aprendizaje por currículos para permitir que los agentes dominen progresivamente misiones cada vez más complejas, desde el alcance de un solo objetivo hasta la navegación de ida y vuelta. Nuestros resultados experimentales demuestran que el agente entrenado completó con éxito el 95% de las tareas simples de alcance de objetivos y el 70% de las misiones complejas de ida y vuelta. El agente mantuvo un rendimiento estable incluso con múltiples subobjetivos, logrando más del 75% de tasa de éxito en misiones de tres subobjetivos, lo que indica un fuerte potencial para aplicaciones prácticas en la planificación de rutas de UAV.