Aceleración de hardware y aproximación de cálculos de CNN: estudio de caso sobre una versión entera de LeNet
Autores: Leveugle, Régis; Cogney, Arthur; Gah El Hilal, Ahmed Baba; Lailler, Tristan; Pieau, Maxime
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aceleración de hardware y aproximación de cálculos de CNN: estudio de caso sobre una versión entera de LeNet
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Sistemas de IA
Sistemas integrados
Redes neuronales
Aproximación
Aceleración de hardware
Computación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Los sistemas de inteligencia artificial tienen un impacto creciente y extenso en muchas áreas de aplicación. Los sistemas integrados construidos con inteligencia artificial tienen fuertes restricciones de implementación conflictivas, incluyendo alta velocidad de cálculo, bajo consumo de energía, alta eficiencia energética, robustez y bajo costo. Las Redes Neuronales (NNs) utilizadas por estos sistemas son intrínsecamente parcialmente tolerantes a las perturbaciones de cálculo. Como consecuencia, son un objetivo interesante para la computación aproximada que busca reducir recursos, disminuir el consumo de energía y acelerar el cálculo. Además, el gran número de cálculos requeridos por una sola inferencia hace que la aceleración de hardware sea casi inevitable para cumplir globalmente con las restricciones de diseño. El estudio reportado, basado en una versión entera de LeNet, muestra las posibles ganancias al combinar aproximación y aceleración de hardware. Las principales conclusiones pueden ser aprovechadas al considerar otros tipos de NNs. La primera es que varios tipos de aproximación que parecen muy similares pueden mostrar compensaciones muy diferentes entre la pérdida de precisión y las optimizaciones de hardware, por lo que la aproximación seleccionada debe elegirse cuidadosamente. Además, una aproximación fuerte que conduzca al mejor hardware también puede llevar a la mejor precisión. Este es el caso aquí al seleccionar la aproximación de sumador ApxFA5 definida en la literatura. Finalmente, combinar aceleración de hardware y operadores aproximados de manera coherente también aumenta las ganancias globales.
Descripción
Los sistemas de inteligencia artificial tienen un impacto creciente y extenso en muchas áreas de aplicación. Los sistemas integrados construidos con inteligencia artificial tienen fuertes restricciones de implementación conflictivas, incluyendo alta velocidad de cálculo, bajo consumo de energía, alta eficiencia energética, robustez y bajo costo. Las Redes Neuronales (NNs) utilizadas por estos sistemas son intrínsecamente parcialmente tolerantes a las perturbaciones de cálculo. Como consecuencia, son un objetivo interesante para la computación aproximada que busca reducir recursos, disminuir el consumo de energía y acelerar el cálculo. Además, el gran número de cálculos requeridos por una sola inferencia hace que la aceleración de hardware sea casi inevitable para cumplir globalmente con las restricciones de diseño. El estudio reportado, basado en una versión entera de LeNet, muestra las posibles ganancias al combinar aproximación y aceleración de hardware. Las principales conclusiones pueden ser aprovechadas al considerar otros tipos de NNs. La primera es que varios tipos de aproximación que parecen muy similares pueden mostrar compensaciones muy diferentes entre la pérdida de precisión y las optimizaciones de hardware, por lo que la aproximación seleccionada debe elegirse cuidadosamente. Además, una aproximación fuerte que conduzca al mejor hardware también puede llevar a la mejor precisión. Este es el caso aquí al seleccionar la aproximación de sumador ApxFA5 definida en la literatura. Finalmente, combinar aceleración de hardware y operadores aproximados de manera coherente también aumenta las ganancias globales.