logo móvil
Contáctanos

Evitación de colisiones de UAV en escenarios desconocidos con desentrelazado de representación causal

Autores: Fan, Zhun; Xia, Zihao; Lin, Che; Han, Gaofei; Li, Wenji; Wang, Dongliang; Chen, Yindong; Hao, Zhifeng; Cai, Ruichu; Zhuang, Jiafan

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Evitación de colisiones de UAV en escenarios desconocidos con desentrelazado de representación causal


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Aprendizaje por refuerzo
Vehículos aéreos no tripulados
Planificación de rutas
Aprendizaje profundo por refuerzo
Desentrelazado de representaciones causales
Generalizabilidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El aprendizaje profundo por refuerzo (DRL) ha avanzado significativamente en la planificación de rutas en línea para vehículos aéreos no tripulados (UAV). No obstante, los métodos basados en DRL a menudo enfrentan una reducción en el rendimiento al tratar con escenarios desconocidos. Este declive se debe principalmente a la presencia de elementos no causales y específicos del dominio dentro de las representaciones visuales, que impactan negativamente en el aprendizaje de políticas. Las técnicas actuales generalmente dependen de métodos de aumento o regularización predefinidos destinados a dirigir el modelo hacia la identificación de componentes causales e invariantes del dominio, mejorando así la capacidad del modelo para generalizar. Sin embargo, estos enfoques elaborados manualmente están intrínsecamente limitados en su cobertura y no consideran todo el espectro de posibles escenarios, lo que resulta en un rendimiento menos efectivo en nuevos entornos. A diferencia de estudios anteriores, este trabajo prioriza el aprendizaje de representaciones y presenta un nuevo método para el desentrelazado de representaciones causales. El enfoque distingue con éxito entre elementos causales y no causales en los datos visuales. Al concentrarse en aspectos causales durante la fase de aprendizaje de políticas, se minimiza el impacto de los factores no causales, mejorando así la capacidad de generalización de los modelos de DRL. Los resultados experimentales demuestran que nuestra técnica logra una navegación confiable y una evitación efectiva de colisiones en escenarios no vistos, superando a los algoritmos de aprendizaje profundo por refuerzo de última generación.

Otros recursos que podrían interesarte

Temas Virtualpro