Un esquema de defensa adversarial basado en máscaras
Autores: Xu, Weizhen; Zhang, Chenyi; Zhao, Fangzhen; Fang, Liangda
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un esquema de defensa adversarial basado en máscaras
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Ataques adversariales
Redes neuronales profundas
Esquema de defensa
Enmascaramiento
Perturbaciones
Resultados experimentales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Los ataques adversarios obstaculizan la funcionalidad y precisión de las redes neuronales profundas (DNNs) al interferir con perturbaciones sutiles en sus entradas. En este trabajo, proponemos un nuevo esquema de defensa adversaria basado en máscaras (MAD) para DNNs con el fin de mitigar el efecto negativo de los ataques adversarios. Nuestro método preprocesa múltiples copias de una imagen adversaria potencial aplicando máscaras aleatorias, antes de combinar las salidas de la DNN en todas las imágenes aleatoriamente enmascaradas. Como resultado, la salida final combinada se vuelve más tolerante a las perturbaciones menores en la entrada original. En comparación con las técnicas de defensa adversaria existentes, nuestro método no necesita ninguna estructura adicional de eliminación de ruido ni ningún cambio en el diseño arquitectónico de una DNN. Hemos probado este enfoque en una colección de modelos de DNN para una variedad de conjuntos de datos, y los resultados experimentales confirman que el método propuesto puede mejorar efectivamente las capacidades de defensa de las DNNs contra todos los métodos de ataque adversario probados. En ciertos escenarios, los modelos de DNN entrenados con MAD pueden mejorar la precisión de clasificación en comparación con los modelos originales cuando se les proporcionan entradas adversarias.
Descripción
Los ataques adversarios obstaculizan la funcionalidad y precisión de las redes neuronales profundas (DNNs) al interferir con perturbaciones sutiles en sus entradas. En este trabajo, proponemos un nuevo esquema de defensa adversaria basado en máscaras (MAD) para DNNs con el fin de mitigar el efecto negativo de los ataques adversarios. Nuestro método preprocesa múltiples copias de una imagen adversaria potencial aplicando máscaras aleatorias, antes de combinar las salidas de la DNN en todas las imágenes aleatoriamente enmascaradas. Como resultado, la salida final combinada se vuelve más tolerante a las perturbaciones menores en la entrada original. En comparación con las técnicas de defensa adversaria existentes, nuestro método no necesita ninguna estructura adicional de eliminación de ruido ni ningún cambio en el diseño arquitectónico de una DNN. Hemos probado este enfoque en una colección de modelos de DNN para una variedad de conjuntos de datos, y los resultados experimentales confirman que el método propuesto puede mejorar efectivamente las capacidades de defensa de las DNNs contra todos los métodos de ataque adversario probados. En ciertos escenarios, los modelos de DNN entrenados con MAD pueden mejorar la precisión de clasificación en comparación con los modelos originales cuando se les proporcionan entradas adversarias.