Aprendizaje Profundo por Refuerzo para Evacuación de Emergencia en Aeropuertos en Tiempo Real Utilizando el Algoritmo Actor-Crítico de Ventaja Asincrónica (A3C)
Autores: Zhou, Yujing; Yang, Yupeng; Pan, Bill Deng; Liu, Yongxin; Namilae, Sirish; Song, Houbing Herbert; Liu, Dahai
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aprendizaje Profundo por Refuerzo para Evacuación de Emergencia en Aeropuertos en Tiempo Real Utilizando el Algoritmo Actor-Crítico de Ventaja Asincrónica (A3C)
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Emergencias
Aviación
Evacuación
Algoritmo A3C
Aprendizaje profundo por refuerzo
Apoyo a la toma de decisiones en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Las emergencias pueden ocurrir inesperadamente y requerir acción inmediata, especialmente en la aviación, donde la presión del tiempo y la incertidumbre son altas. Este estudio se centró en mejorar la evacuación de emergencia en escenarios de aeropuertos y aeronaves utilizando soporte de toma de decisiones en tiempo real. Se desarrolló un sistema basado en el algoritmo Asynchronous Advantage Actor-Critic (A3C), un método avanzado de aprendizaje profundo por refuerzo, para generar rutas de evacuación más rápidas y eficientes en comparación con modelos tradicionales. El modelo A3C se probó en varios escenarios, incluidas diferentes condiciones ambientales y números de agentes, y su rendimiento se comparó con el algoritmo Deep Q-Network (DQN). Los resultados mostraron que A3C logró evacuaciones un 43,86% más rápidas en promedio y convergió en menos episodios (100 vs. 250 para DQN). En entornos dinámicos con amenazas en movimiento, A3C también superó a DQN en mantener la seguridad de los agentes y adaptar rutas en tiempo real. A medida que aumentaba el número de agentes, A3C mantuvo altos niveles de eficiencia y robustez. Estos hallazgos demuestran el fuerte potencial de A3C para mejorar la planificación de evacuaciones a través de una mayor velocidad, adaptabilidad y escalabilidad. El estudio concluye destacando los beneficios prácticos de aplicar tales modelos en sistemas de respuesta a emergencias del mundo real, incluidos tiempos de evacuación significativamente más rápidos, adaptabilidad en tiempo real a amenazas en evolución y mayor escalabilidad para gestionar grandes multitudes en entornos de alta densidad, incluidas las terminales de aeropuertos. El modelo basado en A3C ofrece una alternativa rentable a simulacros de evacuación a gran escala al permitir pruebas de escenarios virtuales, respalda la planificación proactiva de la seguridad a través de la modelización predictiva y contribuye al desarrollo de herramientas inteligentes de soporte de decisiones que mejoran la coordinación y reducen el tiempo de respuesta durante emergencias.
Descripción
Las emergencias pueden ocurrir inesperadamente y requerir acción inmediata, especialmente en la aviación, donde la presión del tiempo y la incertidumbre son altas. Este estudio se centró en mejorar la evacuación de emergencia en escenarios de aeropuertos y aeronaves utilizando soporte de toma de decisiones en tiempo real. Se desarrolló un sistema basado en el algoritmo Asynchronous Advantage Actor-Critic (A3C), un método avanzado de aprendizaje profundo por refuerzo, para generar rutas de evacuación más rápidas y eficientes en comparación con modelos tradicionales. El modelo A3C se probó en varios escenarios, incluidas diferentes condiciones ambientales y números de agentes, y su rendimiento se comparó con el algoritmo Deep Q-Network (DQN). Los resultados mostraron que A3C logró evacuaciones un 43,86% más rápidas en promedio y convergió en menos episodios (100 vs. 250 para DQN). En entornos dinámicos con amenazas en movimiento, A3C también superó a DQN en mantener la seguridad de los agentes y adaptar rutas en tiempo real. A medida que aumentaba el número de agentes, A3C mantuvo altos niveles de eficiencia y robustez. Estos hallazgos demuestran el fuerte potencial de A3C para mejorar la planificación de evacuaciones a través de una mayor velocidad, adaptabilidad y escalabilidad. El estudio concluye destacando los beneficios prácticos de aplicar tales modelos en sistemas de respuesta a emergencias del mundo real, incluidos tiempos de evacuación significativamente más rápidos, adaptabilidad en tiempo real a amenazas en evolución y mayor escalabilidad para gestionar grandes multitudes en entornos de alta densidad, incluidas las terminales de aeropuertos. El modelo basado en A3C ofrece una alternativa rentable a simulacros de evacuación a gran escala al permitir pruebas de escenarios virtuales, respalda la planificación proactiva de la seguridad a través de la modelización predictiva y contribuye al desarrollo de herramientas inteligentes de soporte de decisiones que mejoran la coordinación y reducen el tiempo de respuesta durante emergencias.