Atacando el hardware de IA de aprendizaje profundo con perturbaciones adversariales universales
Autores: Sadi, Mehdi; Talukder, Bashir Mohammad Sabquat Bahar; Mishty, Kaniz; Rahman, Md Tauhidur
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Atacando el hardware de IA de aprendizaje profundo con perturbaciones adversariales universales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Perturbaciones adversariales universales
Aprendizaje profundo
Redes neuronales
Estrategia de ataque
Acelerador de hardware de IA
Contramedidas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las perturbaciones universales adversariales son ruido independiente de la imagen y del modelo que, al añadirse a cualquier imagen, pueden engañar a las redes neuronales convolucionales profundas entrenadas hacia una predicción incorrecta. Dado que estas perturbaciones universales adversariales pueden poner en serio peligro la seguridad y la integridad de las aplicaciones prácticas de aprendizaje profundo, las técnicas existentes utilizan redes neuronales adicionales para detectar la existencia de estos ruidos en la fuente de la imagen de entrada. En este artículo, demostramos una estrategia de ataque que, cuando se activa por medios maliciosos (por ejemplo, malware, troyano), puede eludir estas contramedidas existentes al aumentar el ruido adversarial en la etapa del acelerador de hardware de IA. Demostramos el ataque de ruido adversarial universal a nivel de acelerador en varios modelos de aprendizaje profundo utilizando la co-simulación del núcleo de software de la función Conv2D y el modelo RTL de Verilog del hardware en el entorno de FuseSoC.
Descripción
Las perturbaciones universales adversariales son ruido independiente de la imagen y del modelo que, al añadirse a cualquier imagen, pueden engañar a las redes neuronales convolucionales profundas entrenadas hacia una predicción incorrecta. Dado que estas perturbaciones universales adversariales pueden poner en serio peligro la seguridad y la integridad de las aplicaciones prácticas de aprendizaje profundo, las técnicas existentes utilizan redes neuronales adicionales para detectar la existencia de estos ruidos en la fuente de la imagen de entrada. En este artículo, demostramos una estrategia de ataque que, cuando se activa por medios maliciosos (por ejemplo, malware, troyano), puede eludir estas contramedidas existentes al aumentar el ruido adversarial en la etapa del acelerador de hardware de IA. Demostramos el ataque de ruido adversarial universal a nivel de acelerador en varios modelos de aprendizaje profundo utilizando la co-simulación del núcleo de software de la función Conv2D y el modelo RTL de Verilog del hardware en el entorno de FuseSoC.