Un acelerador escalable y flexible para bloques de múltiples ramas de DNN en sistemas integrados
Autores: Yang, Dawei; Li, Xinlei; Qi, Lizhe; Zhang, Wenqiang; Jiang, Zhe
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un acelerador escalable y flexible para bloques de múltiples ramas de DNN en sistemas integrados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Aceleradores de DNN
Operaciones de DNN
Flexibilidad
Compatibilidad
Rendimiento del sistema
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Las redes neuronales profundas (DNNs) son ampliamente utilizadas en muchas aplicaciones de inteligencia artificial; se han propuesto muchos aceleradores especializados de inferencia DNN. Sin embargo, los aceleradores DNN existentes dependen en gran medida de ciertos tipos de operaciones DNN (como Conv, FC y ReLU, etc.), que son menos utilizadas o probablemente quedarán obsoletas en el futuro, planteando desafíos de flexibilidad y compatibilidad con el trabajo existente. Este documento diseña un acelerador DNN flexible desde una perspectiva más genérica en lugar de acelerar ciertos tipos de operaciones DNN. Nuestra propuesta explota la propiedad de ancho de las DNNs y logra una mejora significativa en el rendimiento del sistema y la eficiencia energética sobre las arquitecturas de múltiples ramas. es un marco único en su tipo para DNNs de múltiples ramas.
Descripción
Las redes neuronales profundas (DNNs) son ampliamente utilizadas en muchas aplicaciones de inteligencia artificial; se han propuesto muchos aceleradores especializados de inferencia DNN. Sin embargo, los aceleradores DNN existentes dependen en gran medida de ciertos tipos de operaciones DNN (como Conv, FC y ReLU, etc.), que son menos utilizadas o probablemente quedarán obsoletas en el futuro, planteando desafíos de flexibilidad y compatibilidad con el trabajo existente. Este documento diseña un acelerador DNN flexible desde una perspectiva más genérica en lugar de acelerar ciertos tipos de operaciones DNN. Nuestra propuesta explota la propiedad de ancho de las DNNs y logra una mejora significativa en el rendimiento del sistema y la eficiencia energética sobre las arquitecturas de múltiples ramas. es un marco único en su tipo para DNNs de múltiples ramas.