Un diseño de hardware eficiente para un sistema de predicción de flujo de tráfico de baja latencia utilizando una red neuronal en línea
Autores: Hanafy, Yasmin Adel; Mashaly, Maggie; Abd El Ghany, Mohamed A.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un diseño de hardware eficiente para un sistema de predicción de flujo de tráfico de baja latencia utilizando una red neuronal en línea
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Sistema de red neuronal en línea
Predicción de flujo de tráfico
Algoritmos de aprendizaje automático
Retropropagación de cobertura
Fpga
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Las redes neuronales son sistemas informáticos inspirados en las redes neuronales biológicas en los cerebros humanos. Son entrenadas en modo de aprendizaje por lotes; por lo tanto, todos los datos de entrenamiento deben estar listos antes de la tarea de entrenamiento. Sin embargo, esto no es aplicable para muchas aplicaciones en tiempo real donde los datos llegan de forma secuencial, como la detección de temas en línea en comunidades sociales, la predicción del flujo de tráfico, etc. En este artículo, se propone una implementación eficiente en hardware de un sistema de red neuronal en línea de baja latencia para una aplicación de predicción de flujo de tráfico. El modelo propuesto se implementa con diferentes algoritmos de Aprendizaje Automático (ML) para predecir el flujo de tráfico con alta precisión, donde el modelo de Retropropagación de Hedge (HBP) logra el menor error absoluto medio (MAE) de 0.001. El sistema propuesto se implementa utilizando aritmética de punto flotante y de punto fijo en la parte de FPGA del ZedBoard. La implementación se realiza utilizando la arquitectura BRAM y la memoria distribuida en FPGA para lograr el mejor equilibrio entre latencia, consumo de área y potencia. Utilizando el enfoque de punto fijo, los tiempos de predicción utilizando las arquitecturas de memoria distribuida y BRAM son de 150 ns y 420 ns, respectivamente. El producto de retraso de área (ADP) del sistema propuesto se reduce en 17 veces en comparación con la implementación en hardware del último sistema propuesto en la literatura. El tiempo de ejecución del sistema de hardware propuesto se mejora en 200 veces en comparación con el software implementado en un CPU Intel i7-7500U de doble núcleo a 2.9 GHz. En consecuencia, el modelo de hardware propuesto es más rápido que el modelo de software y más adecuado para modelos de aprendizaje automático en línea críticos en tiempo.
Descripción
Las redes neuronales son sistemas informáticos inspirados en las redes neuronales biológicas en los cerebros humanos. Son entrenadas en modo de aprendizaje por lotes; por lo tanto, todos los datos de entrenamiento deben estar listos antes de la tarea de entrenamiento. Sin embargo, esto no es aplicable para muchas aplicaciones en tiempo real donde los datos llegan de forma secuencial, como la detección de temas en línea en comunidades sociales, la predicción del flujo de tráfico, etc. En este artículo, se propone una implementación eficiente en hardware de un sistema de red neuronal en línea de baja latencia para una aplicación de predicción de flujo de tráfico. El modelo propuesto se implementa con diferentes algoritmos de Aprendizaje Automático (ML) para predecir el flujo de tráfico con alta precisión, donde el modelo de Retropropagación de Hedge (HBP) logra el menor error absoluto medio (MAE) de 0.001. El sistema propuesto se implementa utilizando aritmética de punto flotante y de punto fijo en la parte de FPGA del ZedBoard. La implementación se realiza utilizando la arquitectura BRAM y la memoria distribuida en FPGA para lograr el mejor equilibrio entre latencia, consumo de área y potencia. Utilizando el enfoque de punto fijo, los tiempos de predicción utilizando las arquitecturas de memoria distribuida y BRAM son de 150 ns y 420 ns, respectivamente. El producto de retraso de área (ADP) del sistema propuesto se reduce en 17 veces en comparación con la implementación en hardware del último sistema propuesto en la literatura. El tiempo de ejecución del sistema de hardware propuesto se mejora en 200 veces en comparación con el software implementado en un CPU Intel i7-7500U de doble núcleo a 2.9 GHz. En consecuencia, el modelo de hardware propuesto es más rápido que el modelo de software y más adecuado para modelos de aprendizaje automático en línea críticos en tiempo.