logo móvil
Contáctanos

Un diseño de hardware eficiente para un sistema de predicción de flujo de tráfico de baja latencia utilizando una red neuronal en línea

Autores: Hanafy, Yasmin Adel; Mashaly, Maggie; Abd El Ghany, Mohamed A.

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Un diseño de hardware eficiente para un sistema de predicción de flujo de tráfico de baja latencia utilizando una red neuronal en línea


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Redes neuronales
Sistema de red neuronal en línea
Predicción de flujo de tráfico
Algoritmos de aprendizaje automático
Retropropagación de cobertura
Fpga

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones


Descripción
Las redes neuronales son sistemas informáticos inspirados en las redes neuronales biológicas en los cerebros humanos. Son entrenadas en modo de aprendizaje por lotes; por lo tanto, todos los datos de entrenamiento deben estar listos antes de la tarea de entrenamiento. Sin embargo, esto no es aplicable para muchas aplicaciones en tiempo real donde los datos llegan de forma secuencial, como la detección de temas en línea en comunidades sociales, la predicción del flujo de tráfico, etc. En este artículo, se propone una implementación eficiente en hardware de un sistema de red neuronal en línea de baja latencia para una aplicación de predicción de flujo de tráfico. El modelo propuesto se implementa con diferentes algoritmos de Aprendizaje Automático (ML) para predecir el flujo de tráfico con alta precisión, donde el modelo de Retropropagación de Hedge (HBP) logra el menor error absoluto medio (MAE) de 0.001. El sistema propuesto se implementa utilizando aritmética de punto flotante y de punto fijo en la parte de FPGA del ZedBoard. La implementación se realiza utilizando la arquitectura BRAM y la memoria distribuida en FPGA para lograr el mejor equilibrio entre latencia, consumo de área y potencia. Utilizando el enfoque de punto fijo, los tiempos de predicción utilizando las arquitecturas de memoria distribuida y BRAM son de 150 ns y 420 ns, respectivamente. El producto de retraso de área (ADP) del sistema propuesto se reduce en 17 veces en comparación con la implementación en hardware del último sistema propuesto en la literatura. El tiempo de ejecución del sistema de hardware propuesto se mejora en 200 veces en comparación con el software implementado en un CPU Intel i7-7500U de doble núcleo a 2.9 GHz. En consecuencia, el modelo de hardware propuesto es más rápido que el modelo de software y más adecuado para modelos de aprendizaje automático en línea críticos en tiempo.

Otros recursos que podrían interesarte

Temas Virtualpro