Alpri-fi: un marco para la evaluación temprana de la resiliencia a fallas de hardware de los aceleradores de DNN
Autores: Mahmoud, Karim; Nicolici, Nicola
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Alpri-fi: un marco para la evaluación temprana de la resiliencia a fallas de hardware de los aceleradores de DNN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Hardware
Modelos de aprendizaje automático
Aceleradores de DNN
Resiliencia a fallas
ALPRI-FI
Preocupaciones de confiabilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Comprender cómo el hardware defectuoso afecta a los modelos de aprendizaje automático es importante tanto para los sistemas críticos de seguridad como para la infraestructura en la nube. Dado que la mayoría de los modelos de aprendizaje automático, como las Redes Neuronales Profundas (DNN), son altamente intensivos en cómputo, se desarrollan aceleradores de hardware especializados para mejorar el rendimiento y la eficiencia energética. Evaluar la resistencia a fallos de estos aceleradores de DNN durante las primeras etapas de diseño e implementación proporciona retroalimentación oportuna, lo que hace que sea menos costoso revisar los diseños y abordar posibles problemas de fiabilidad. Con este fin, presentamos la Inyección de Fallos de Implementación a Nivel de Registro de Pre-Transferencia a Nivel de Arquitectura (ALPRI-FI), que es un marco integral para evaluar la resistencia a fallos de modelos de DNN implementados en aceleradores de hardware.
Descripción
Comprender cómo el hardware defectuoso afecta a los modelos de aprendizaje automático es importante tanto para los sistemas críticos de seguridad como para la infraestructura en la nube. Dado que la mayoría de los modelos de aprendizaje automático, como las Redes Neuronales Profundas (DNN), son altamente intensivos en cómputo, se desarrollan aceleradores de hardware especializados para mejorar el rendimiento y la eficiencia energética. Evaluar la resistencia a fallos de estos aceleradores de DNN durante las primeras etapas de diseño e implementación proporciona retroalimentación oportuna, lo que hace que sea menos costoso revisar los diseños y abordar posibles problemas de fiabilidad. Con este fin, presentamos la Inyección de Fallos de Implementación a Nivel de Registro de Pre-Transferencia a Nivel de Arquitectura (ALPRI-FI), que es un marco integral para evaluar la resistencia a fallos de modelos de DNN implementados en aceleradores de hardware.