Método de selección de ruta antiinterferencia en una red de comunicación inalámbrica basado en Dyna-Q
Autores: Zhang, Guoliang; Li, Yonggui; Niu, Yingtao; Zhou, Quan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Método de selección de ruta antiinterferencia en una red de comunicación inalámbrica basado en Dyna-Q
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ruta de transmisión
Red de comunicación inalámbrica
Algoritmo antiinterferencias
Dyna-Q
Tasa de pérdida de paquetes
Tabla Q
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Apuntando a establecer eficientemente la ruta de transmisión óptima en una red de comunicación inalámbrica en un entorno de interferencia maliciosa, este documento propone un algoritmo anti-interferencias basado en Dyna-Q. Basado en observaciones previas del entorno, el algoritmo selecciona el nodo secuencial óptimo buscando en la tabla Q para reducir la tasa de pérdida de paquetes. El algoritmo puede acelerar la actualización de la tabla Q basándose en experiencias anteriores. La tabla Q converge rápidamente al valor óptimo. Esto es beneficioso para la selección óptima de nodos posteriores. Los resultados de la simulación muestran que el algoritmo propuesto tiene la ventaja de una velocidad de convergencia más rápida en comparación con el algoritmo de aprendizaje por refuerzo sin modelo.
Descripción
Apuntando a establecer eficientemente la ruta de transmisión óptima en una red de comunicación inalámbrica en un entorno de interferencia maliciosa, este documento propone un algoritmo anti-interferencias basado en Dyna-Q. Basado en observaciones previas del entorno, el algoritmo selecciona el nodo secuencial óptimo buscando en la tabla Q para reducir la tasa de pérdida de paquetes. El algoritmo puede acelerar la actualización de la tabla Q basándose en experiencias anteriores. La tabla Q converge rápidamente al valor óptimo. Esto es beneficioso para la selección óptima de nodos posteriores. Los resultados de la simulación muestran que el algoritmo propuesto tiene la ventaja de una velocidad de convergencia más rápida en comparación con el algoritmo de aprendizaje por refuerzo sin modelo.