Mejorando la transferibilidad de ejemplos adversarios con transformación de características
Autores: Xu, Hao-Qi; Hu, Cong; Yin, He-Feng
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Mejorando la transferibilidad de ejemplos adversarios con transformación de características
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Transferibilidad
Ejemplos adversarios
Redes neuronales profundas
Método basado en transformación de características
Robustez
Tasa de éxito del ataque
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La transferibilidad de ejemplos adversarios permite al atacante engañar a las redes neuronales profundas (DNN) sin conocer ninguna información sobre los modelos objetivo. El método actual basado en la transformación de la entrada genera ejemplos adversarios transformando la imagen en el espacio de entrada, lo que integra implícitamente un conjunto de modelos al concatenar la transformación de imagen en el modelo entrenado. Sin embargo, los métodos basados en la transformación de la entrada ignoran la incrustación de la variedad y apenas extraen información intrínseca de datos de alta dimensionalidad. A este respecto, proponemos un método novedoso basado en la transformación de características (FTM), que realiza la transformación de características en el espacio de características. FTM puede mejorar la robustez del ejemplo adversario al transformar las características de los datos. Combinando FTM, se extraen las características intrínsecas de los ejemplos adversarios para generar ejemplos adversarios transferibles. Los resultados experimentales en dos conjuntos de datos de referencia muestran que FTM podría mejorar efectivamente la tasa de éxito del ataque (ASR) de los métodos de última generación (SOTA). FTM mejora la tasa de éxito del ataque del Método Escala-Invariante en Inception_v3 de 62.6% a 75.1% en ImageNet, lo que representa un amplio margen de 12.5%.
Descripción
La transferibilidad de ejemplos adversarios permite al atacante engañar a las redes neuronales profundas (DNN) sin conocer ninguna información sobre los modelos objetivo. El método actual basado en la transformación de la entrada genera ejemplos adversarios transformando la imagen en el espacio de entrada, lo que integra implícitamente un conjunto de modelos al concatenar la transformación de imagen en el modelo entrenado. Sin embargo, los métodos basados en la transformación de la entrada ignoran la incrustación de la variedad y apenas extraen información intrínseca de datos de alta dimensionalidad. A este respecto, proponemos un método novedoso basado en la transformación de características (FTM), que realiza la transformación de características en el espacio de características. FTM puede mejorar la robustez del ejemplo adversario al transformar las características de los datos. Combinando FTM, se extraen las características intrínsecas de los ejemplos adversarios para generar ejemplos adversarios transferibles. Los resultados experimentales en dos conjuntos de datos de referencia muestran que FTM podría mejorar efectivamente la tasa de éxito del ataque (ASR) de los métodos de última generación (SOTA). FTM mejora la tasa de éxito del ataque del Método Escala-Invariante en Inception_v3 de 62.6% a 75.1% en ImageNet, lo que representa un amplio margen de 12.5%.