Optimizando redes neuronales artificiales para minimizar errores aritméticos en implementaciones de computación estocástica
Autores: Frasser, Christiam F.; Morán, Alejandro; Canals, Vincent; Font, Joan; Isern, Eugeni; Roca, Miquel; Rosselló, Josep L.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Optimizando redes neuronales artificiales para minimizar errores aritméticos en implementaciones de computación estocástica
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Optimizaciones
Cuantización
Eficiencia energética
Computación estocástica
FPGA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Implementar redes neuronales modernas en dispositivos de borde con recursos limitados requiere una serie de optimizaciones para prepararlas para la producción. Estas optimizaciones suelen involucrar poda, cuantización y conversión de punto fijo para comprimir el tamaño del modelo y mejorar la eficiencia energética. Si bien estas optimizaciones suelen ser adecuadas para la mayoría de los dispositivos de borde, existe el potencial de mejorar aún más la eficiencia energética aprovechando hardware especializado y paradigmas de computación no convencionales. En este estudio, exploramos las redes neuronales de computación estocástica y su impacto en la cuantización y el rendimiento general en relación con las distribuciones de pesos. Cuando las operaciones aritméticas como la suma y la multiplicación son ejecutadas por hardware de computación estocástica, el error aritmético puede aumentar significativamente, lo que lleva a una disminución en la precisión general. Para cerrar la brecha de precisión entre un modelo de punto fijo y su implementación de computación estocástica, proponemos un nuevo método de entrenamiento aproximado consciente de la aritmética. Validamos la eficacia de nuestro enfoque implementando la red neuronal convolucional LeNet-5 en un FPGA. Nuestros resultados experimentales revelan una degradación de precisión insignificante de apenas 0,01% en comparación con el equivalente en punto flotante, al tiempo que logran una aceleración sustancial de 27 veces y una mejora de 33 veces en la eficiencia energética en comparación con otras implementaciones en FPGA. Además, el método propuesto mejora la probabilidad de seleccionar semillas LFSR óptimas para sistemas de computación estocástica.
Descripción
Implementar redes neuronales modernas en dispositivos de borde con recursos limitados requiere una serie de optimizaciones para prepararlas para la producción. Estas optimizaciones suelen involucrar poda, cuantización y conversión de punto fijo para comprimir el tamaño del modelo y mejorar la eficiencia energética. Si bien estas optimizaciones suelen ser adecuadas para la mayoría de los dispositivos de borde, existe el potencial de mejorar aún más la eficiencia energética aprovechando hardware especializado y paradigmas de computación no convencionales. En este estudio, exploramos las redes neuronales de computación estocástica y su impacto en la cuantización y el rendimiento general en relación con las distribuciones de pesos. Cuando las operaciones aritméticas como la suma y la multiplicación son ejecutadas por hardware de computación estocástica, el error aritmético puede aumentar significativamente, lo que lleva a una disminución en la precisión general. Para cerrar la brecha de precisión entre un modelo de punto fijo y su implementación de computación estocástica, proponemos un nuevo método de entrenamiento aproximado consciente de la aritmética. Validamos la eficacia de nuestro enfoque implementando la red neuronal convolucional LeNet-5 en un FPGA. Nuestros resultados experimentales revelan una degradación de precisión insignificante de apenas 0,01% en comparación con el equivalente en punto flotante, al tiempo que logran una aceleración sustancial de 27 veces y una mejora de 33 veces en la eficiencia energética en comparación con otras implementaciones en FPGA. Además, el método propuesto mejora la probabilidad de seleccionar semillas LFSR óptimas para sistemas de computación estocástica.