logo móvil
Contáctanos

Defendiendo ataques adversarios contra modelos de clasificación de imágenes DNN mediante un método de fusión de ruido

Autores: Shi, Lin; Liao, Teyi; He, Jianfeng

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Defendiendo ataques adversarios contra modelos de clasificación de imágenes DNN mediante un método de fusión de ruido


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Ataques adversarios
Métodos de defensa
Método de Fusión de Ruido
Modelos de redes neuronales profundas
MNIST
CIFAR-10

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 23

Citaciones: Sin citaciones


Descripción
Los ataques adversarios engañan a los modelos de redes neuronales profundas al agregar datos de ataque imperceptiblemente pequeños pero bien diseñados a la entrada del modelo. Esos ataques causan graves problemas. Se han proporcionado varios métodos de defensa para defenderse contra esos ataques mediante: (1) proporcionar entrenamiento adversario de acuerdo con ataques específicos; (2) eliminar el ruido de los datos de entrada; (3) preprocesar los datos de entrada; y (4) agregar ruido a varias capas de modelos. Aquí proporcionamos un Método de Fusión de Ruido (NFM, por sus siglas en inglés) simple pero efectivo para defenderse de ataques adversarios contra modelos de clasificación de imágenes DNN. Sin conocer detalles sobre los ataques o modelos, NFM no solo agrega ruido a la entrada del modelo en tiempo de ejecución, sino también a los datos de entrenamiento en tiempo de entrenamiento. Se aplican dos ataques l, el Método de Gradiente Rápido Firmado (FGSM) y la Descenso de Gradiente Proyectado (PGD), y un ataque l, el Descenso L1 Escaso (SLD), para evaluar los efectos de defensa del NFM en varios modelos de redes neuronales profundas que utilizan conjuntos de datos MNIST y CIFAR-10. Se aplican varios ruidos de amplitud con diferentes distribuciones estadísticas para mostrar los efectos de defensa del NFM en diferentes ruidos. El NFM también se compara con un método de entrenamiento adversario en los conjuntos de datos MNIST y CIFAR-10. Los resultados muestran que agregar ruido a las imágenes de entrada y las imágenes de entrenamiento no solo se defiende contra los tres ataques adversarios, sino que también mejora la robustez de los modelos correspondientes. Los resultados indican posiblemente efectos de defensa generalizados del NFM que pueden extenderse a otros ataques adversarios. También muestra la aplicación potencial del NFM a modelos no solo con entrada de imagen, sino también con entrada de voz o audio.

Otros recursos que podrían interesarte

Temas Virtualpro