logo móvil
Contáctanos

Un marco de aprendizaje por refuerzo multiagente tolerante a fallos para la planificación de rutas de cobertura de vehículos aéreos no tripulados y vehículos terrestres no tripulados

Autores: Ramezani, Mahya; Amiri Atashgah, M. A.; Rezaee, Alireza

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Un marco de aprendizaje por refuerzo multiagente tolerante a fallos para la planificación de rutas de cobertura de vehículos aéreos no tripulados y vehículos terrestres no tripulados


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Tolerante a fallos
Aprendizaje por refuerzo multiagente
UAVs
Planificación de rutas de cobertura
Sistema de comunicación
Experiencia compartida de repetición

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
En este artículo, introducimos un marco de aprendizaje por refuerzo multiagente tolerante a fallos llamado SERT-DQN para optimizar las operaciones de UAVs con control central de UGV en misiones de planificación de rutas de cobertura. Nuestro enfoque aprovecha sistemas de aprendizaje dual que combinan la autonomía de los agentes individuales con la planificación estratégica centralizada, mejorando así la eficiencia de las misiones de planificación de rutas cooperativas. Este marco está diseñado para un alto rendimiento en entornos con incertidumbre de fallos detectados y desafíos operativos como interrupciones en la conectividad y la fiabilidad comprometida de los sensores. Con la integración de un sistema de comunicación innovador entre agentes, nuestro sistema maneja adecuadamente tanto entornos estáticos como dinámicos. Además, introducimos un replay de experiencia compartida basado en similitudes para lograr una convergencia más rápida y eficiencia de muestras en el sistema multiagente. La arquitectura está especialmente diseñada para responder de manera adaptativa a tales irregularidades, mostrando efectivamente una mayor resiliencia en escenarios donde la integridad de los datos se ve afectada debido a fallos o el UAV enfrenta interrupciones. Los resultados de simulación indican que nuestros algoritmos de tolerancia a fallos son muy resilientes y efectivamente mejoran los resultados de las misiones, especialmente en condiciones operativas dinámicas y altamente inciertas. Este enfoque se vuelve crítico para la investigación más reciente basada en sensores en sistemas autónomos.

Otros recursos que podrían interesarte

Temas Virtualpro