Promoviendo la transferibilidad adversarial a través de la agregación de varianza de muestreo dual y ataques de heterogeneidad de características
Autores: Huang, Yang; Chen, Yuling; Wang, Xuewei; Yang, Jing; Wang, Qi
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Promoviendo la transferibilidad adversarial a través de la agregación de varianza de muestreo dual y ataques de heterogeneidad de características
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales profundas
Ataque adversarial
Ataques de caja blanca
Caso de caja negra
Muestras adversariales
Transferibilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
En la actualidad, las redes neuronales profundas se han utilizado ampliamente en diversos campos, pero su vulnerabilidad requiere atención. El ataque adversario tiene como objetivo engañar al modelo generando perturbaciones imperceptibles en el modelo fuente, y aunque los ataques de caja blanca han logrado altas tasas de éxito, las muestras adversarias existentes muestran una débil migración en el caso de caja negra, especialmente en algunos modelos de defensa entrenados adversarialmente. El trabajo previo para la optimización basada en gradientes optimiza la imagen antes de la iteración o los gradientes durante la iteración, lo que resulta en que las muestras adversarias generadas se sobreajusten al modelo fuente y muestren una baja movilidad hacia el modelo entrenado adversarialmente. Para resolver estos problemas, proponemos la agregación de varianza de muestras duales con ataque de heterogeneidad de características; nuestro método se optimiza antes y durante las iteraciones para producir muestras adversarias con una mejor transferibilidad. Además, nuestro método se puede integrar con varias transformaciones de entrada. Una gran cantidad de datos experimentales demuestran la efectividad del método propuesto, que mejora la tasa de éxito del ataque en un 5.9% para el modelo entrenado normalmente y un 11.5% para el modelo entrenado adversarialmente en comparación con los métodos de ataque de mejora de migración de vanguardia actuales.
Descripción
En la actualidad, las redes neuronales profundas se han utilizado ampliamente en diversos campos, pero su vulnerabilidad requiere atención. El ataque adversario tiene como objetivo engañar al modelo generando perturbaciones imperceptibles en el modelo fuente, y aunque los ataques de caja blanca han logrado altas tasas de éxito, las muestras adversarias existentes muestran una débil migración en el caso de caja negra, especialmente en algunos modelos de defensa entrenados adversarialmente. El trabajo previo para la optimización basada en gradientes optimiza la imagen antes de la iteración o los gradientes durante la iteración, lo que resulta en que las muestras adversarias generadas se sobreajusten al modelo fuente y muestren una baja movilidad hacia el modelo entrenado adversarialmente. Para resolver estos problemas, proponemos la agregación de varianza de muestras duales con ataque de heterogeneidad de características; nuestro método se optimiza antes y durante las iteraciones para producir muestras adversarias con una mejor transferibilidad. Además, nuestro método se puede integrar con varias transformaciones de entrada. Una gran cantidad de datos experimentales demuestran la efectividad del método propuesto, que mejora la tasa de éxito del ataque en un 5.9% para el modelo entrenado normalmente y un 11.5% para el modelo entrenado adversarialmente en comparación con los métodos de ataque de mejora de migración de vanguardia actuales.