Batg: un método de ataque de puerta trasera basado en la generación de desencadenantes
Autores: Tang, Weixuan; Xie, Haoke; Rao, Yuan; Long, Min; Qi, Tao; Zhou, Zhili
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Batg: un método de ataque de puerta trasera basado en la generación de desencadenantes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ataques de puerta trasera
Redes neuronales profundas
Generación de desencadenantes
Red neuronal invertible
Compresión de imagen
Robustez
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Los ataques de puerta trasera tienen como objetivo implantar puertas traseras ocultas en Redes Neuronales Profundas (DNNs) para que los modelos víctima funcionen bien en imágenes limpias, mientras que sus predicciones serían cambiadas maliciosamente en imágenes envenenadas. Sin embargo, la mayoría de los ataques de puerta trasera existentes carecen de la invisibilidad y robustez necesarias para aplicaciones del mundo real, especialmente cuando se trata de resistir técnicas de compresión de imágenes, como JPEG y WEBP. Para abordar estos problemas, en este documento, proponemos un Método de Ataque de Puerta Trasera basado en Generación de Desencadenantes (BATG). Específicamente, se utiliza una red generativa convolucional profunda como modelo de generación de desencadenantes para generar imágenes de desencadenantes efectivas y se utiliza una Red Neuronal Invertible (INN) como modelo de inyección de desencadenantes para incrustar las imágenes de desencadenantes generadas en imágenes limpias y crear imágenes envenenadas. Además, se utiliza una capa de ruido para simular ataques de compresión de imágenes para el entrenamiento adversarial, mejorando la robustez contra la compresión de imágenes del mundo real. Experimentos exhaustivos en conjuntos de datos de referencia demuestran la efectividad, invisibilidad y robustez del BATG propuesto.
Descripción
Los ataques de puerta trasera tienen como objetivo implantar puertas traseras ocultas en Redes Neuronales Profundas (DNNs) para que los modelos víctima funcionen bien en imágenes limpias, mientras que sus predicciones serían cambiadas maliciosamente en imágenes envenenadas. Sin embargo, la mayoría de los ataques de puerta trasera existentes carecen de la invisibilidad y robustez necesarias para aplicaciones del mundo real, especialmente cuando se trata de resistir técnicas de compresión de imágenes, como JPEG y WEBP. Para abordar estos problemas, en este documento, proponemos un Método de Ataque de Puerta Trasera basado en Generación de Desencadenantes (BATG). Específicamente, se utiliza una red generativa convolucional profunda como modelo de generación de desencadenantes para generar imágenes de desencadenantes efectivas y se utiliza una Red Neuronal Invertible (INN) como modelo de inyección de desencadenantes para incrustar las imágenes de desencadenantes generadas en imágenes limpias y crear imágenes envenenadas. Además, se utiliza una capa de ruido para simular ataques de compresión de imágenes para el entrenamiento adversarial, mejorando la robustez contra la compresión de imágenes del mundo real. Experimentos exhaustivos en conjuntos de datos de referencia demuestran la efectividad, invisibilidad y robustez del BATG propuesto.