Una Imitación MARL Elite Consciente de Características para la Optimización de Trayectorias de Múltiples UAV en la Detección de Terreno Montañoso
Autores: Zhou, Quanxi; Tao, Ye; Su, Qianxiao; Tsukada, Manabu
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Una Imitación MARL Elite Consciente de Características para la Optimización de Trayectorias de Múltiples UAV en la Detección de Terreno Montañoso
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Avance
Planificación de trayectorias de UAV
Tecnologías de detección
Vehículos aéreos no tripulados
Detección de alta precisión
Tareas de búsqueda
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con el avance de la planificación de trayectorias de UAV y las tecnologías de detección, los vehículos aéreos no tripulados (UAV) son ahora capaces de realizar tareas de detección y búsqueda en el suelo de alto rendimiento. Las regiones montañosas, debido a su terreno complejo, han sido durante mucho tiempo un punto focal en el campo de la teledetección. Las tareas de búsqueda efectivas de UAV en tales áreas deben considerar no solo la cobertura horizontal, sino también las variaciones en el rango y el ángulo de detección causadas por cambios en la elevación. Los algoritmos convencionales suelen requerir un conocimiento previo completo del entorno para la optimización de trayectorias y a menudo dependen de modelos de políticas específicos del escenario, lo que limita su generalizabilidad. Para abordar estos desafíos, este documento propone un algoritmo de Aprendizaje por Refuerzo Multi-Agente de Imitación Elite Consciente de Características (FA-EIMARL) que aprovecha la información parcial del terreno para construir una red de extracción de características. Este enfoque permite el entrenamiento por lotes en terrenos diversos sin la necesidad de mapas ambientales completos. Además, se ha propuesto un mecanismo de imitación elite para la aceleración de la convergencia y la mejora del rendimiento de la tarea. Los resultados de simulación demuestran que el método propuesto logra un rendimiento de recompensa superior, una tasa de convergencia y una eficiencia computacional, manteniendo una fuerte adaptabilidad a terrenos variables.
Descripción
Con el avance de la planificación de trayectorias de UAV y las tecnologías de detección, los vehículos aéreos no tripulados (UAV) son ahora capaces de realizar tareas de detección y búsqueda en el suelo de alto rendimiento. Las regiones montañosas, debido a su terreno complejo, han sido durante mucho tiempo un punto focal en el campo de la teledetección. Las tareas de búsqueda efectivas de UAV en tales áreas deben considerar no solo la cobertura horizontal, sino también las variaciones en el rango y el ángulo de detección causadas por cambios en la elevación. Los algoritmos convencionales suelen requerir un conocimiento previo completo del entorno para la optimización de trayectorias y a menudo dependen de modelos de políticas específicos del escenario, lo que limita su generalizabilidad. Para abordar estos desafíos, este documento propone un algoritmo de Aprendizaje por Refuerzo Multi-Agente de Imitación Elite Consciente de Características (FA-EIMARL) que aprovecha la información parcial del terreno para construir una red de extracción de características. Este enfoque permite el entrenamiento por lotes en terrenos diversos sin la necesidad de mapas ambientales completos. Además, se ha propuesto un mecanismo de imitación elite para la aceleración de la convergencia y la mejora del rendimiento de la tarea. Los resultados de simulación demuestran que el método propuesto logra un rendimiento de recompensa superior, una tasa de convergencia y una eficiencia computacional, manteniendo una fuerte adaptabilidad a terrenos variables.