Un protocolo de enrutamiento resiliente para reducir el costo de actualización mediante aprendizaje no supervisado y aprendizaje profundo por refuerzo en redes móviles ad hoc

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un protocolo de enrutamiento resiliente para reducir el costo de actualización mediante aprendizaje no supervisado y aprendizaje profundo por refuerzo en redes móviles ad hoc

Autores: Suh, BeomKyu; Akobir, Ismatov; Kim, Jian; Park, YongBeom; Kim, Ki-Il

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Un protocolo de enrutamiento resiliente para reducir el costo de actualización mediante aprendizaje no supervisado y aprendizaje profundo por refuerzo en redes móviles ad hoc

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje por refuerzo

Protocolo de enrutamiento

Redes móviles ad hoc

Aprendizaje no supervisado

Aprendizaje profundo por refuerzo

Ratio de entrega de paquetes

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 60

Citaciones: Sin citaciones

Se ha propuesto un protocolo de enrutamiento basado en Aprendizaje por Refuerzo (RL) para establecer rutas en redes móviles ad hoc. Sin embargo, debido a la sobrecarga de actualizar los valores de recompensa de acuerdo con los frecuentes cambios de topología, los protocolos existentes basados en RL sufren problemas de escalabilidad con un gran número de espacios de estado y acción. Para vencer este problema, en este documento, proponemos un nuevo protocolo de enrutamiento resiliente aplicando Aprendizaje No Supervisado (UL) antes del Aprendizaje Profundo por Refuerzo (DRL). En el esquema anterior, cada nodo se agrupa según parámetros resilientes a la movilidad. Un camino confiable que consiste solo en nodos robustos en UL es decidido por DRL con un valor de peso razonable a través de Toma de Decisiones Multiobjetivo (MCDM). Este enfoque lleva a una reducción en el costo de actualización del valor de recompensa al excluir nodos que se consideran gravemente afectados por la movilidad. Los resultados de simulación comparativos demostraron que el esquema propuesto superó al esquema existente en los aspectos de Tasa de Entrega de Paquetes (PDR) y consumo de energía. Nuestro protocolo demuestra hasta un 35% más de PDR y reduce el uso de energía en aproximadamente un 20% en condiciones de alta movilidad en comparación con los protocolos basados en Q-Learning.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro