Avanzando en la Optimización Dinámica de Rutas de Emergencia con un Modelo de Aprendizaje por Refuerzo Profundo de Red Compuesta
Autores: Zhang, Jin; Xu, Hao; Liu, Ding; Yu, Qi
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Avanzando en la Optimización Dinámica de Rutas de Emergencia con un Modelo de Aprendizaje por Refuerzo Profundo de Red Compuesta
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Logística de emergencia
Respuesta a desastres
Modelo de red neuronal
Aprendizaje por refuerzo profundo
Problema de enrutamiento dinámico
Marco actor-crítico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La logística de emergencia es esencial para una respuesta rápida y eficiente ante desastres, asegurando la disponibilidad y el despliegue oportuno de recursos en las áreas afectadas. En el proceso de trabajo de rescate, los cambios dinámicos en la información de los puntos de rescate aumentan considerablemente la dificultad del rescate. Este documento establece un modelo de red neuronal combinada considerando una penalización por ventana de tiempo suave y aplica el aprendizaje por refuerzo profundo (DRL) para abordar el problema de enrutamiento dinámico en la logística de emergencia. Este método utiliza el marco actor-crítico, combinado con mecanismos de atención, redes de punteros y redes neuronales de memoria a corto y largo plazo, para determinar un camino efectivo de ayuda humanitaria, y compara el esquema de programación obtenido con los resultados obtenidos del algoritmo DRL basado en el modelo de red única y el algoritmo de optimización por colonia de hormigas (ACO). Los experimentos de simulación muestran que el método propuesto reduce la precisión de la solución en casi un 10% en comparación con el algoritmo ACO, pero ahorra casi un 80% en tiempo de solución. Además, aumenta ligeramente los tiempos de solución pero mejora la precisión en casi un 20% en comparación con los enfoques tradicionales de DRL, demostrando un equilibrio prometedor entre la eficiencia del rendimiento y la utilización de recursos computacionales en la logística de emergencia.
Descripción
La logística de emergencia es esencial para una respuesta rápida y eficiente ante desastres, asegurando la disponibilidad y el despliegue oportuno de recursos en las áreas afectadas. En el proceso de trabajo de rescate, los cambios dinámicos en la información de los puntos de rescate aumentan considerablemente la dificultad del rescate. Este documento establece un modelo de red neuronal combinada considerando una penalización por ventana de tiempo suave y aplica el aprendizaje por refuerzo profundo (DRL) para abordar el problema de enrutamiento dinámico en la logística de emergencia. Este método utiliza el marco actor-crítico, combinado con mecanismos de atención, redes de punteros y redes neuronales de memoria a corto y largo plazo, para determinar un camino efectivo de ayuda humanitaria, y compara el esquema de programación obtenido con los resultados obtenidos del algoritmo DRL basado en el modelo de red única y el algoritmo de optimización por colonia de hormigas (ACO). Los experimentos de simulación muestran que el método propuesto reduce la precisión de la solución en casi un 10% en comparación con el algoritmo ACO, pero ahorra casi un 80% en tiempo de solución. Además, aumenta ligeramente los tiempos de solución pero mejora la precisión en casi un 20% en comparación con los enfoques tradicionales de DRL, demostrando un equilibrio prometedor entre la eficiencia del rendimiento y la utilización de recursos computacionales en la logística de emergencia.