Un marco de aprendizaje por refuerzo multiagente tolerante a fallos para la planificación de rutas de cobertura de vehículos aéreos no tripulados y vehículos terrestres no tripulados

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un marco de aprendizaje por refuerzo multiagente tolerante a fallos para la planificación de rutas de cobertura de vehículos aéreos no tripulados y vehículos terrestres no tripulados

Autores: Ramezani, Mahya; Amiri Atashgah, M. A.; Rezaee, Alireza

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Un marco de aprendizaje por refuerzo multiagente tolerante a fallos para la planificación de rutas de cobertura de vehículos aéreos no tripulados y vehículos terrestres no tripulados

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Tolerante a fallos

Aprendizaje por refuerzo multiagente

UAVs

Planificación de rutas de cobertura

Sistema de comunicación

Experiencia compartida de repetición

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

En este artículo, introducimos un marco de aprendizaje por refuerzo multiagente tolerante a fallos llamado SERT-DQN para optimizar las operaciones de UAVs con control central de UGV en misiones de planificación de rutas de cobertura. Nuestro enfoque aprovecha sistemas de aprendizaje dual que combinan la autonomía de los agentes individuales con la planificación estratégica centralizada, mejorando así la eficiencia de las misiones de planificación de rutas cooperativas. Este marco está diseñado para un alto rendimiento en entornos con incertidumbre de fallos detectados y desafíos operativos como interrupciones en la conectividad y la fiabilidad comprometida de los sensores. Con la integración de un sistema de comunicación innovador entre agentes, nuestro sistema maneja adecuadamente tanto entornos estáticos como dinámicos. Además, introducimos un replay de experiencia compartida basado en similitudes para lograr una convergencia más rápida y eficiencia de muestras en el sistema multiagente. La arquitectura está especialmente diseñada para responder de manera adaptativa a tales irregularidades, mostrando efectivamente una mayor resiliencia en escenarios donde la integridad de los datos se ve afectada debido a fallos o el UAV enfrenta interrupciones. Los resultados de simulación indican que nuestros algoritmos de tolerancia a fallos son muy resilientes y efectivamente mejoran los resultados de las misiones, especialmente en condiciones operativas dinámicas y altamente inciertas. Este enfoque se vuelve crítico para la investigación más reciente basada en sensores en sistemas autónomos.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro