Un protocolo de enrutamiento resiliente para reducir el costo de actualización mediante aprendizaje no supervisado y aprendizaje profundo por refuerzo en redes móviles ad hoc
Autores: Suh, BeomKyu; Akobir, Ismatov; Kim, Jian; Park, YongBeom; Kim, Ki-Il
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un protocolo de enrutamiento resiliente para reducir el costo de actualización mediante aprendizaje no supervisado y aprendizaje profundo por refuerzo en redes móviles ad hoc
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje por refuerzo
Protocolo de enrutamiento
Redes móviles ad hoc
Aprendizaje no supervisado
Aprendizaje profundo por refuerzo
Ratio de entrega de paquetes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 60
Citaciones: Sin citaciones
Se ha propuesto un protocolo de enrutamiento basado en Aprendizaje por Refuerzo (RL) para establecer rutas en redes móviles ad hoc. Sin embargo, debido a la sobrecarga de actualizar los valores de recompensa de acuerdo con los frecuentes cambios de topología, los protocolos existentes basados en RL sufren problemas de escalabilidad con un gran número de espacios de estado y acción. Para vencer este problema, en este documento, proponemos un nuevo protocolo de enrutamiento resiliente aplicando Aprendizaje No Supervisado (UL) antes del Aprendizaje Profundo por Refuerzo (DRL). En el esquema anterior, cada nodo se agrupa según parámetros resilientes a la movilidad. Un camino confiable que consiste solo en nodos robustos en UL es decidido por DRL con un valor de peso razonable a través de Toma de Decisiones Multiobjetivo (MCDM). Este enfoque lleva a una reducción en el costo de actualización del valor de recompensa al excluir nodos que se consideran gravemente afectados por la movilidad. Los resultados de simulación comparativos demostraron que el esquema propuesto superó al esquema existente en los aspectos de Tasa de Entrega de Paquetes (PDR) y consumo de energía. Nuestro protocolo demuestra hasta un 35% más de PDR y reduce el uso de energía en aproximadamente un 20% en condiciones de alta movilidad en comparación con los protocolos basados en Q-Learning.
Descripción
Se ha propuesto un protocolo de enrutamiento basado en Aprendizaje por Refuerzo (RL) para establecer rutas en redes móviles ad hoc. Sin embargo, debido a la sobrecarga de actualizar los valores de recompensa de acuerdo con los frecuentes cambios de topología, los protocolos existentes basados en RL sufren problemas de escalabilidad con un gran número de espacios de estado y acción. Para vencer este problema, en este documento, proponemos un nuevo protocolo de enrutamiento resiliente aplicando Aprendizaje No Supervisado (UL) antes del Aprendizaje Profundo por Refuerzo (DRL). En el esquema anterior, cada nodo se agrupa según parámetros resilientes a la movilidad. Un camino confiable que consiste solo en nodos robustos en UL es decidido por DRL con un valor de peso razonable a través de Toma de Decisiones Multiobjetivo (MCDM). Este enfoque lleva a una reducción en el costo de actualización del valor de recompensa al excluir nodos que se consideran gravemente afectados por la movilidad. Los resultados de simulación comparativos demostraron que el esquema propuesto superó al esquema existente en los aspectos de Tasa de Entrega de Paquetes (PDR) y consumo de energía. Nuestro protocolo demuestra hasta un 35% más de PDR y reduce el uso de energía en aproximadamente un 20% en condiciones de alta movilidad en comparación con los protocolos basados en Q-Learning.