AdsAttack: un algoritmo de ataque adversarial a través de la búsqueda de distribución adversarial en el espacio latente
Autores: Wang, Haobo; Zhu, Chenxi; Cao, Yangjie; Zhuang, Yan; Li, Jie; Chen, Xianfu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
AdsAttack: un algoritmo de ataque adversarial a través de la búsqueda de distribución adversarial en el espacio latente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Ejemplos adversarios
Aprendizaje profundo
Transferibilidad
Costo computacional
Espacio latente de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Las redes neuronales profundas son susceptibles a la interferencia de ruido deliberadamente creado, lo que puede llevar a resultados incorrectos de clasificación. Los enfoques existentes hacen menos uso de la información del espacio latente y realizan modificaciones en el dominio de píxeles en lugar del espacio de entrada, lo que aumenta el costo computacional y disminuye la transferibilidad. En este trabajo, proponemos un algoritmo de ataque impulsado por la búsqueda de distribuciones adversariales efectivas (ADSAttack) para generar ejemplos adversariales contra redes neuronales profundas. ADSAttack introduce una red afiliada para buscar distribuciones potenciales en el espacio latente de la imagen para sintetizar ejemplos adversariales. ADSAttack utiliza un algoritmo de detección de bordes para localizar un mapeo de características de bajo nivel en el espacio de entrada para delinear el área perturbada efectiva mínima. Los resultados experimentales muestran que ADSAttack logra una mayor transferibilidad, una mejor visualización imperceptible y una generación más rápida en comparación con los algoritmos tradicionales. Para generar 1000 ejemplos adversariales, ADSAttack tarda y, en promedio, logra una tasa de éxito de .
Descripción
Las redes neuronales profundas son susceptibles a la interferencia de ruido deliberadamente creado, lo que puede llevar a resultados incorrectos de clasificación. Los enfoques existentes hacen menos uso de la información del espacio latente y realizan modificaciones en el dominio de píxeles en lugar del espacio de entrada, lo que aumenta el costo computacional y disminuye la transferibilidad. En este trabajo, proponemos un algoritmo de ataque impulsado por la búsqueda de distribuciones adversariales efectivas (ADSAttack) para generar ejemplos adversariales contra redes neuronales profundas. ADSAttack introduce una red afiliada para buscar distribuciones potenciales en el espacio latente de la imagen para sintetizar ejemplos adversariales. ADSAttack utiliza un algoritmo de detección de bordes para localizar un mapeo de características de bajo nivel en el espacio de entrada para delinear el área perturbada efectiva mínima. Los resultados experimentales muestran que ADSAttack logra una mayor transferibilidad, una mejor visualización imperceptible y una generación más rápida en comparación con los algoritmos tradicionales. Para generar 1000 ejemplos adversariales, ADSAttack tarda y, en promedio, logra una tasa de éxito de .