Cobertura de Estación Base Montada en UAV y Optimización de Trayectorias Usando LSTM-A2C con Atención
Autores: Worku, Yonatan M.; Christodoulou, Christos; Devetsikiotis, Michael
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Cobertura de Estación Base Montada en UAV y Optimización de Trayectorias Usando LSTM-A2C con Atención
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Operaciones de ayuda en desastres
Vehículos aéreos no tripulados
Redes de comunicación
Trayectorias
Cobertura
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En las operaciones de ayuda en desastres, los Vehículos Aéreos No Tripulados (VANT) equipados con estaciones base (VANT-EB) son vitales para restablecer redes de comunicación donde la infraestructura convencional ha sido comprometida. Optimizar sus trayectorias y cobertura para garantizar una entrega de servicio equitativa en medio de obstáculos, efectos del viento y limitaciones de energía sigue siendo un desafío formidable. Este documento propone un innovador marco de aprendizaje por refuerzo que aprovecha un modelo de Actor-Crítico (A2C) basado en Memoria a Largo y Corto Plazo (LSTM) mejorado con un mecanismo de atención. Operando dentro de un entorno de desastre basado en una cuadrícula, nuestro enfoque busca maximizar la cobertura justa para usuarios terrestres distribuidos aleatoriamente bajo estrictas limitaciones de energía. Incorpora un modelo de movimiento en nueve direcciones y una estrategia de comunicación centrada en la equidad que prioriza a los usuarios no atendidos, mejorando así tanto la equidad como la eficiencia. El mecanismo de atención mejora la adaptabilidad al dirigir el enfoque hacia áreas críticas, como grupos de usuarios no atendidos. Los resultados de la simulación revelan que nuestro método supera a las técnicas de aprendizaje por refuerzo de referencia en equidad de cobertura, Calidad de Servicio (QoS) y eficiencia energética, proporcionando una solución escalable y efectiva para la respuesta en tiempo real ante desastres.
Descripción
En las operaciones de ayuda en desastres, los Vehículos Aéreos No Tripulados (VANT) equipados con estaciones base (VANT-EB) son vitales para restablecer redes de comunicación donde la infraestructura convencional ha sido comprometida. Optimizar sus trayectorias y cobertura para garantizar una entrega de servicio equitativa en medio de obstáculos, efectos del viento y limitaciones de energía sigue siendo un desafío formidable. Este documento propone un innovador marco de aprendizaje por refuerzo que aprovecha un modelo de Actor-Crítico (A2C) basado en Memoria a Largo y Corto Plazo (LSTM) mejorado con un mecanismo de atención. Operando dentro de un entorno de desastre basado en una cuadrícula, nuestro enfoque busca maximizar la cobertura justa para usuarios terrestres distribuidos aleatoriamente bajo estrictas limitaciones de energía. Incorpora un modelo de movimiento en nueve direcciones y una estrategia de comunicación centrada en la equidad que prioriza a los usuarios no atendidos, mejorando así tanto la equidad como la eficiencia. El mecanismo de atención mejora la adaptabilidad al dirigir el enfoque hacia áreas críticas, como grupos de usuarios no atendidos. Los resultados de la simulación revelan que nuestro método supera a las técnicas de aprendizaje por refuerzo de referencia en equidad de cobertura, Calidad de Servicio (QoS) y eficiencia energética, proporcionando una solución escalable y efectiva para la respuesta en tiempo real ante desastres.