Una encuesta sobre redes neuronales gráficas computacionalmente eficientes para sistemas reconfigurables
Autores: Kose, Habib Taha; Nunez-Yanez, Jose; Piechocki, Robert; Pope, James
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Una encuesta sobre redes neuronales gráficas computacionalmente eficientes para sistemas reconfigurables
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Redes neuronales gráficas
Eficiencia computacional
Hardware reconfigurable
Cuantificación
Sistemas embebidos
Aceleración basada en FPGA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las redes neuronales de grafos (GNNs) son modelos poderosos capaces de gestionar conexiones intrincadas en datos no euclidianos, como redes sociales, sistemas físicos, estructuras químicas y redes de comunicación. A pesar de su efectividad, la naturaleza a gran escala y compleja de los datos de grafos exige recursos computacionales sustanciales y un alto rendimiento tanto en las etapas de entrenamiento como de inferencia, presentando desafíos significativos, particularmente en el contexto de sistemas embebidos. Estudios recientes sobre GNNs han investigado tanto soluciones de software como de hardware para mejorar la eficiencia computacional. Estudios anteriores sobre redes neuronales profundas (DNNs) han indicado que métodos como hardware reconfigurable y cuantización son beneficiosos para abordar estos problemas. A diferencia de la investigación en DNN, los estudios sobre métodos computacionales eficientes para GNNs están menos desarrollados y requieren más exploración. Esta encuesta revisa los últimos desarrollos en cuantización y aceleración basada en FPGA para GNNs, mostrando las capacidades de los sistemas reconfigurables (a menudo FPGAs) para ofrecer soluciones personalizadas en entornos marcados por una gran escasez y la necesidad de gestión dinámica de carga. También enfatiza el papel de la cuantización en la reducción de las demandas computacionales y de memoria a través del uso de aritmética de punto fijo y formatos de vector simplificados. Este documento se concentra en dispositivos de bajo consumo y recursos limitados sobre aceleradores de hardware generales y revisa la investigación aplicable a sistemas embebidos. Además, proporciona una discusión detallada sobre posibles brechas de investigación, conocimientos fundamentales, obstáculos y direcciones futuras prospectivas.
Descripción
Las redes neuronales de grafos (GNNs) son modelos poderosos capaces de gestionar conexiones intrincadas en datos no euclidianos, como redes sociales, sistemas físicos, estructuras químicas y redes de comunicación. A pesar de su efectividad, la naturaleza a gran escala y compleja de los datos de grafos exige recursos computacionales sustanciales y un alto rendimiento tanto en las etapas de entrenamiento como de inferencia, presentando desafíos significativos, particularmente en el contexto de sistemas embebidos. Estudios recientes sobre GNNs han investigado tanto soluciones de software como de hardware para mejorar la eficiencia computacional. Estudios anteriores sobre redes neuronales profundas (DNNs) han indicado que métodos como hardware reconfigurable y cuantización son beneficiosos para abordar estos problemas. A diferencia de la investigación en DNN, los estudios sobre métodos computacionales eficientes para GNNs están menos desarrollados y requieren más exploración. Esta encuesta revisa los últimos desarrollos en cuantización y aceleración basada en FPGA para GNNs, mostrando las capacidades de los sistemas reconfigurables (a menudo FPGAs) para ofrecer soluciones personalizadas en entornos marcados por una gran escasez y la necesidad de gestión dinámica de carga. También enfatiza el papel de la cuantización en la reducción de las demandas computacionales y de memoria a través del uso de aritmética de punto fijo y formatos de vector simplificados. Este documento se concentra en dispositivos de bajo consumo y recursos limitados sobre aceleradores de hardware generales y revisa la investigación aplicable a sistemas embebidos. Además, proporciona una discusión detallada sobre posibles brechas de investigación, conocimientos fundamentales, obstáculos y direcciones futuras prospectivas.