Ddsg-gan: red generativa adversarial con discriminadores duales y generador único para ataques de caja negra
Autores: Wang, Fangwei; Ma, Zerou; Zhang, Xiaohan; Li, Qingru; Wang, Changguang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Ddsg-gan: red generativa adversarial con discriminadores duales y generador único para ataques de caja negra
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Amenazas de seguridad
Inteligencia artificial
Ataque adversario
Ataque de caja negra
GAN
Ataque de robo de modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Como una de las diez principales amenazas de seguridad enfrentadas por la inteligencia artificial, el ataque adversario ha llevado a los académicos a pensar profundamente desde la teoría hasta la práctica. Sin embargo, en el escenario de ataque de caja negra, cómo mejorar la calidad visual de un ejemplo adversario (AE) y realizar una consulta más eficiente debería ser explorado aún más. Este estudio tiene como objetivo utilizar la arquitectura de GAN combinada con el ataque de robo de modelo para entrenar modelos sustitutos y generar AE de alta calidad. Este estudio propone un método de generación de AE de imagen basado en las redes generativas adversarias con dos discriminadores y un generador único (DDSG-GAN) y diseña la función de pérdida correspondiente para cada modelo. El generador puede generar perturbaciones adversarias, y dos discriminadores limitan la perturbación, respectivamente, para garantizar la calidad visual y el efecto de ataque del AE generado. Experimentamos ampliamente en los conjuntos de datos MNIST, CIFAR10 y Tiny-ImageNet. Los resultados experimentales ilustran que nuestro método puede utilizar eficazmente la retroalimentación de la consulta para generar un AE, lo que reduce significativamente el número de consultas en el modelo objetivo y puede implementar ataques efectivos.
Descripción
Como una de las diez principales amenazas de seguridad enfrentadas por la inteligencia artificial, el ataque adversario ha llevado a los académicos a pensar profundamente desde la teoría hasta la práctica. Sin embargo, en el escenario de ataque de caja negra, cómo mejorar la calidad visual de un ejemplo adversario (AE) y realizar una consulta más eficiente debería ser explorado aún más. Este estudio tiene como objetivo utilizar la arquitectura de GAN combinada con el ataque de robo de modelo para entrenar modelos sustitutos y generar AE de alta calidad. Este estudio propone un método de generación de AE de imagen basado en las redes generativas adversarias con dos discriminadores y un generador único (DDSG-GAN) y diseña la función de pérdida correspondiente para cada modelo. El generador puede generar perturbaciones adversarias, y dos discriminadores limitan la perturbación, respectivamente, para garantizar la calidad visual y el efecto de ataque del AE generado. Experimentamos ampliamente en los conjuntos de datos MNIST, CIFAR10 y Tiny-ImageNet. Los resultados experimentales ilustran que nuestro método puede utilizar eficazmente la retroalimentación de la consulta para generar un AE, lo que reduce significativamente el número de consultas en el modelo objetivo y puede implementar ataques efectivos.