Robustez y transferibilidad de los ataques adversarios en diferentes redes neuronales de clasificación de imágenes
Autores: Smagulova, Kamilya; Bacha, Lina; Fouda, Mohammed E.; Kanj, Rouwaida; Eltawil, Ahmed
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Robustez y transferibilidad de los ataques adversarios en diferentes redes neuronales de clasificación de imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ejemplos adversarios
Redes neuronales
Transferibles
Vulnerabilidades
Robustez
Ataques adversarios
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Trabajos recientes demostraron que las perturbaciones imperceptibles en los datos de entrada, conocidas como ejemplos adversarios, pueden inducir a error en la salida de las redes neuronales. Además, el mismo ejemplo adversario puede ser transferible y utilizado para engañar a diferentes modelos neuronales. Tales vulnerabilidades dificultan el uso de redes neuronales en tareas críticas. Hasta donde sabemos, este es el primer documento que evalúa la robustez de los modelos clasificadores de imágenes emergentes inspirados en CNN y transformadores, como SpinalNet y el Transformador Convolucional Compacto (CCT), frente a ataques adversarios de caja blanca y caja negra populares importados de la Caja de Herramientas de Robustez Adversaria (ART). Además, se estudió la transferibilidad adversaria de las muestras generadas entre los modelos dados. Las pruebas se realizaron en el conjunto de datos CIFAR-10, y los resultados obtenidos muestran que el nivel de susceptibilidad de SpinalNet frente a los mismos ataques es similar al del modelo VGG tradicional, mientras que CCT demuestra una mejor generalización y robustez. Los resultados de este trabajo pueden ser utilizados como referencia para estudios posteriores, como el desarrollo de nuevos ataques y mecanismos de defensa.
Descripción
Trabajos recientes demostraron que las perturbaciones imperceptibles en los datos de entrada, conocidas como ejemplos adversarios, pueden inducir a error en la salida de las redes neuronales. Además, el mismo ejemplo adversario puede ser transferible y utilizado para engañar a diferentes modelos neuronales. Tales vulnerabilidades dificultan el uso de redes neuronales en tareas críticas. Hasta donde sabemos, este es el primer documento que evalúa la robustez de los modelos clasificadores de imágenes emergentes inspirados en CNN y transformadores, como SpinalNet y el Transformador Convolucional Compacto (CCT), frente a ataques adversarios de caja blanca y caja negra populares importados de la Caja de Herramientas de Robustez Adversaria (ART). Además, se estudió la transferibilidad adversaria de las muestras generadas entre los modelos dados. Las pruebas se realizaron en el conjunto de datos CIFAR-10, y los resultados obtenidos muestran que el nivel de susceptibilidad de SpinalNet frente a los mismos ataques es similar al del modelo VGG tradicional, mientras que CCT demuestra una mejor generalización y robustez. Los resultados de este trabajo pueden ser utilizados como referencia para estudios posteriores, como el desarrollo de nuevos ataques y mecanismos de defensa.