Enfoque de ataque de puerta trasera basado en síntesis de imágenes para la tarea de clasificación facial
Autores: Na, Hyunsik; Choi, Daeseon
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Enfoque de ataque de puerta trasera basado en síntesis de imágenes para la tarea de clasificación facial
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Ataques traseros
Síntesis de imágenes
Métodos de defensa
Región facial condicional
Tasa de éxito del ataque
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 58
Citaciones: Sin citaciones
A pesar de que las redes neuronales profundas (DNNs) se aplican en varios campos debido a su notable rendimiento, estudios recientes han indicado que los modelos DNN son vulnerables a ataques de puerta trasera. Las imágenes con puertas traseras fueron generadas añadiendo un disparador de puerta trasera en las imágenes originales de entrenamiento, lo que activaba el ataque de puerta trasera. Sin embargo, la mayoría de los métodos de ataque previamente utilizados son notables, no naturales para el ojo humano y fácilmente detectados por ciertos métodos de defensa. En consecuencia, proponemos un ataque de puerta trasera basado en la síntesis de imágenes, que es un enfoque novedoso para evitar este tipo de ataque. Para superar las limitaciones mencionadas anteriormente, establecimos una región facial condicional como el cabello, los ojos o la boca como un disparador y modificamos esa región utilizando una técnica de síntesis de imágenes que reemplazaba la región de la imagen original con la región de la imagen objetivo. Como resultado, logramos una tasa de éxito del ataque de hasta 88.37% utilizando el 20% de las imágenes con puertas traseras sintetizadas inyectadas en el conjunto de datos de entrenamiento, manteniendo al mismo tiempo la precisión del modelo para las imágenes limpias. Además, analizamos las ventajas del enfoque propuesto a través de la transformación de imágenes, la visualización de regiones de activación para los modelos DNN y pruebas humanas. Además de su aplicabilidad en escenarios de cambio de etiqueta y ataques de etiqueta limpia, el método propuesto puede ser utilizado como un enfoque de ataque para amenazar la seguridad en la tarea de clasificación facial.
Descripción
A pesar de que las redes neuronales profundas (DNNs) se aplican en varios campos debido a su notable rendimiento, estudios recientes han indicado que los modelos DNN son vulnerables a ataques de puerta trasera. Las imágenes con puertas traseras fueron generadas añadiendo un disparador de puerta trasera en las imágenes originales de entrenamiento, lo que activaba el ataque de puerta trasera. Sin embargo, la mayoría de los métodos de ataque previamente utilizados son notables, no naturales para el ojo humano y fácilmente detectados por ciertos métodos de defensa. En consecuencia, proponemos un ataque de puerta trasera basado en la síntesis de imágenes, que es un enfoque novedoso para evitar este tipo de ataque. Para superar las limitaciones mencionadas anteriormente, establecimos una región facial condicional como el cabello, los ojos o la boca como un disparador y modificamos esa región utilizando una técnica de síntesis de imágenes que reemplazaba la región de la imagen original con la región de la imagen objetivo. Como resultado, logramos una tasa de éxito del ataque de hasta 88.37% utilizando el 20% de las imágenes con puertas traseras sintetizadas inyectadas en el conjunto de datos de entrenamiento, manteniendo al mismo tiempo la precisión del modelo para las imágenes limpias. Además, analizamos las ventajas del enfoque propuesto a través de la transformación de imágenes, la visualización de regiones de activación para los modelos DNN y pruebas humanas. Además de su aplicabilidad en escenarios de cambio de etiqueta y ataques de etiqueta limpia, el método propuesto puede ser utilizado como un enfoque de ataque para amenazar la seguridad en la tarea de clasificación facial.