Defendiendo ataques adversarios contra modelos de clasificación de imágenes DNN mediante un método de fusión de ruido
Autores: Shi, Lin; Liao, Teyi; He, Jianfeng
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Defendiendo ataques adversarios contra modelos de clasificación de imágenes DNN mediante un método de fusión de ruido
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ataques adversarios
Métodos de defensa
Método de Fusión de Ruido
Modelos de redes neuronales profundas
MNIST
CIFAR-10
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Los ataques adversarios engañan a los modelos de redes neuronales profundas al agregar datos de ataque imperceptiblemente pequeños pero bien diseñados a la entrada del modelo. Esos ataques causan graves problemas. Se han proporcionado varios métodos de defensa para defenderse contra esos ataques mediante: (1) proporcionar entrenamiento adversario de acuerdo con ataques específicos; (2) eliminar el ruido de los datos de entrada; (3) preprocesar los datos de entrada; y (4) agregar ruido a varias capas de modelos. Aquí proporcionamos un Método de Fusión de Ruido (NFM, por sus siglas en inglés) simple pero efectivo para defenderse de ataques adversarios contra modelos de clasificación de imágenes DNN. Sin conocer detalles sobre los ataques o modelos, NFM no solo agrega ruido a la entrada del modelo en tiempo de ejecución, sino también a los datos de entrenamiento en tiempo de entrenamiento. Se aplican dos ataques l, el Método de Gradiente Rápido Firmado (FGSM) y la Descenso de Gradiente Proyectado (PGD), y un ataque l, el Descenso L1 Escaso (SLD), para evaluar los efectos de defensa del NFM en varios modelos de redes neuronales profundas que utilizan conjuntos de datos MNIST y CIFAR-10. Se aplican varios ruidos de amplitud con diferentes distribuciones estadísticas para mostrar los efectos de defensa del NFM en diferentes ruidos. El NFM también se compara con un método de entrenamiento adversario en los conjuntos de datos MNIST y CIFAR-10. Los resultados muestran que agregar ruido a las imágenes de entrada y las imágenes de entrenamiento no solo se defiende contra los tres ataques adversarios, sino que también mejora la robustez de los modelos correspondientes. Los resultados indican posiblemente efectos de defensa generalizados del NFM que pueden extenderse a otros ataques adversarios. También muestra la aplicación potencial del NFM a modelos no solo con entrada de imagen, sino también con entrada de voz o audio.
Descripción
Los ataques adversarios engañan a los modelos de redes neuronales profundas al agregar datos de ataque imperceptiblemente pequeños pero bien diseñados a la entrada del modelo. Esos ataques causan graves problemas. Se han proporcionado varios métodos de defensa para defenderse contra esos ataques mediante: (1) proporcionar entrenamiento adversario de acuerdo con ataques específicos; (2) eliminar el ruido de los datos de entrada; (3) preprocesar los datos de entrada; y (4) agregar ruido a varias capas de modelos. Aquí proporcionamos un Método de Fusión de Ruido (NFM, por sus siglas en inglés) simple pero efectivo para defenderse de ataques adversarios contra modelos de clasificación de imágenes DNN. Sin conocer detalles sobre los ataques o modelos, NFM no solo agrega ruido a la entrada del modelo en tiempo de ejecución, sino también a los datos de entrenamiento en tiempo de entrenamiento. Se aplican dos ataques l, el Método de Gradiente Rápido Firmado (FGSM) y la Descenso de Gradiente Proyectado (PGD), y un ataque l, el Descenso L1 Escaso (SLD), para evaluar los efectos de defensa del NFM en varios modelos de redes neuronales profundas que utilizan conjuntos de datos MNIST y CIFAR-10. Se aplican varios ruidos de amplitud con diferentes distribuciones estadísticas para mostrar los efectos de defensa del NFM en diferentes ruidos. El NFM también se compara con un método de entrenamiento adversario en los conjuntos de datos MNIST y CIFAR-10. Los resultados muestran que agregar ruido a las imágenes de entrada y las imágenes de entrenamiento no solo se defiende contra los tres ataques adversarios, sino que también mejora la robustez de los modelos correspondientes. Los resultados indican posiblemente efectos de defensa generalizados del NFM que pueden extenderse a otros ataques adversarios. También muestra la aplicación potencial del NFM a modelos no solo con entrada de imagen, sino también con entrada de voz o audio.