logo móvil
Contáctanos

Planificación de Misiones de UAV para la Localización de Víctimas Post-Desastre a través del Aprendizaje por Refuerzo Federado Multi-Agente

Autores: Güzey, Alparslan; Çifçi, Mehmet Akif; Yldrm, Fazl; Erdoan, Arda Yaar

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Planificación de Misiones de UAV para la Localización de Víctimas Post-Desastre a través del Aprendizaje por Refuerzo Federado Multi-Agente


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Víctimas atrapadas
Desastres urbanos
Balizas Bluetooth de baja energía
UAVs
Entornos de búsqueda y rescate
Aprendizaje por refuerzo multiagente federado.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La localización rápida de víctimas atrapadas después de desastres urbanos es esencial pero desafiante porque los balizas de Bluetooth Low Energy (BLE) son intermitentes, la propagación de radio está obstruida por escombros, los UAVs tienen limitaciones de energía y el entrenamiento real de múltiples UAVs es impráctico en entornos de búsqueda y rescate (SAR) de alto riesgo. Este estudio formula la localización de víctimas post-desastre como un Dec-POMDP cooperativo y adapta un marco de aprendizaje por refuerzo federado de múltiples agentes basado en FedQMIX. La propuesta combina un modelo de canal sustituto ligero LoS/NLoS, estimación de posición de víctimas basada en PSO, comprobaciones de seguridad de retorno a la base y viabilidad del mapa, una recompensa moldeada alineada con SAR y un estado de entrenamiento centralizado sin fugas basado en ubicaciones de víctimas estimadas en lugar de ubicaciones reales. Cada UAV entrena localmente dentro de un simulador digital gemelo aprendido y comparte periódicamente solo los parámetros de la red QMIX, evitando el intercambio de trayectorias en crudo o registros de RSSI. El marco se evalúa en dos mapas urbanos sintéticos post-terremoto que representan un escenario compacto de retorno a la base y un escenario más grande de llegada al destino. A través de cinco semillas independientes por método y mapa, el Model-Aided FedQMIX logra el rendimiento de localización de víctimas más alto y estable, con la ventaja más clara observada en el escenario más grande de largo horizonte. Pruebas diagnósticas adicionales examinan la sensibilidad al peso de la recompensa, la robustez del cambio de canal RF, la heterogeneidad del hardware BLE/smartphone, la variación de datos de clientes no IID y el FedAvg de clientes parciales bajo actualizaciones de clientes faltantes. Los resultados indican que combinar pistas de localización asistidas por modelo, factorización de valor descentralizada, diseño de objetivos alineados con SAR y compartición de parámetros federados puede mejorar la robustez de las políticas de localización de víctimas basadas en UAV. El marco también aclara consideraciones de implementación para la coordinación SAR federada, incluyendo carga de comunicación, límites de privacidad, experiencia heterogénea del cliente, variabilidad de dispositivos y conectividad intermitente. Este estudio sigue siendo basado en simulaciones, y se requiere una validación futura con UAVs reales, dispositivos BLE y bancos de pruebas inspirados en escombros antes del despliegue operativo.

Otros recursos que podrían interesarte

Temas Virtualpro