Defendiendo ataques adversarios contra modelos de clasificación de imágenes DNN mediante un método de fusión de ruido

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Defendiendo ataques adversarios contra modelos de clasificación de imágenes DNN mediante un método de fusión de ruido

Autores: Shi, Lin; Liao, Teyi; He, Jianfeng

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Defendiendo ataques adversarios contra modelos de clasificación de imágenes DNN mediante un método de fusión de ruido

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Ataques adversarios

Métodos de defensa

Método de Fusión de Ruido

Modelos de redes neuronales profundas

MNIST

CIFAR-10

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 23

Citaciones: Sin citaciones

Los ataques adversarios engañan a los modelos de redes neuronales profundas al agregar datos de ataque imperceptiblemente pequeños pero bien diseñados a la entrada del modelo. Esos ataques causan graves problemas. Se han proporcionado varios métodos de defensa para defenderse contra esos ataques mediante: (1) proporcionar entrenamiento adversario de acuerdo con ataques específicos; (2) eliminar el ruido de los datos de entrada; (3) preprocesar los datos de entrada; y (4) agregar ruido a varias capas de modelos. Aquí proporcionamos un Método de Fusión de Ruido (NFM, por sus siglas en inglés) simple pero efectivo para defenderse de ataques adversarios contra modelos de clasificación de imágenes DNN. Sin conocer detalles sobre los ataques o modelos, NFM no solo agrega ruido a la entrada del modelo en tiempo de ejecución, sino también a los datos de entrenamiento en tiempo de entrenamiento. Se aplican dos ataques l, el Método de Gradiente Rápido Firmado (FGSM) y la Descenso de Gradiente Proyectado (PGD), y un ataque l, el Descenso L1 Escaso (SLD), para evaluar los efectos de defensa del NFM en varios modelos de redes neuronales profundas que utilizan conjuntos de datos MNIST y CIFAR-10. Se aplican varios ruidos de amplitud con diferentes distribuciones estadísticas para mostrar los efectos de defensa del NFM en diferentes ruidos. El NFM también se compara con un método de entrenamiento adversario en los conjuntos de datos MNIST y CIFAR-10. Los resultados muestran que agregar ruido a las imágenes de entrada y las imágenes de entrenamiento no solo se defiende contra los tres ataques adversarios, sino que también mejora la robustez de los modelos correspondientes. Los resultados indican posiblemente efectos de defensa generalizados del NFM que pueden extenderse a otros ataques adversarios. También muestra la aplicación potencial del NFM a modelos no solo con entrada de imagen, sino también con entrada de voz o audio.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro