Ataque adversario de caja negra basado en puntuación en series temporales utilizando clasificación de recocido simulado y defensa basada en postprocesamiento
Autores: Liu, Sichen; Luo, Yuan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Ataque adversario de caja negra basado en puntuación en series temporales utilizando clasificación de recocido simulado y defensa basada en postprocesamiento
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Ataques adversarios
Clasificación de series temporales
Técnicas de defensa
Ataque de caja negra
Defensa ligera
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 50
Citaciones: Sin citaciones
Si bien las redes neuronales profundas (DNNs) han sido ampliamente y exitosamente utilizadas para la clasificación de series temporales (TSC) en la última década, su vulnerabilidad a los ataques adversariales ha recibido poca atención. La mayoría de los métodos de ataque existentes se centran en configuraciones de caja blanca, que son poco realistas ya que los atacantes típicamente solo tienen acceso a las salidas de probabilidad del modelo. Los métodos defensivos también tienen limitaciones, dependiendo principalmente de la reentrenamiento adversarial que degrada la precisión de clasificación y requiere un tiempo de entrenamiento excesivo. Además, proponemos dos nuevos enfoques en este artículo: (1) Un ataque de búsqueda aleatoria basado en recocido simulado que encuentra ejemplos adversariales sin estimación de gradientes, buscando solo en la hiperesfera de norma -norma de perturbaciones permitidas. (2) Una técnica de defensa de post-procesamiento que revierte periódicamente la tendencia de los valores de pérdida correspondientes manteniendo la tendencia general, utilizando solo las puntuaciones de confianza del clasificador como entrada. Los experimentos que aplican estos métodos a modelos InceptionNet entrenados en los benchmarks del conjunto de datos UCR demuestran la efectividad del ataque, logrando tasas de éxito de hasta el 100%. El método de defensa proporcionó protección contra hasta el 91.24% de los ataques mientras se preserva la calidad de predicción. En general, este trabajo aborda brechas importantes en la TSC adversarial al introducir técnicas novedosas de ataque de caja negra y defensa ligera.
Descripción
Si bien las redes neuronales profundas (DNNs) han sido ampliamente y exitosamente utilizadas para la clasificación de series temporales (TSC) en la última década, su vulnerabilidad a los ataques adversariales ha recibido poca atención. La mayoría de los métodos de ataque existentes se centran en configuraciones de caja blanca, que son poco realistas ya que los atacantes típicamente solo tienen acceso a las salidas de probabilidad del modelo. Los métodos defensivos también tienen limitaciones, dependiendo principalmente de la reentrenamiento adversarial que degrada la precisión de clasificación y requiere un tiempo de entrenamiento excesivo. Además, proponemos dos nuevos enfoques en este artículo: (1) Un ataque de búsqueda aleatoria basado en recocido simulado que encuentra ejemplos adversariales sin estimación de gradientes, buscando solo en la hiperesfera de norma -norma de perturbaciones permitidas. (2) Una técnica de defensa de post-procesamiento que revierte periódicamente la tendencia de los valores de pérdida correspondientes manteniendo la tendencia general, utilizando solo las puntuaciones de confianza del clasificador como entrada. Los experimentos que aplican estos métodos a modelos InceptionNet entrenados en los benchmarks del conjunto de datos UCR demuestran la efectividad del ataque, logrando tasas de éxito de hasta el 100%. El método de defensa proporcionó protección contra hasta el 91.24% de los ataques mientras se preserva la calidad de predicción. En general, este trabajo aborda brechas importantes en la TSC adversarial al introducir técnicas novedosas de ataque de caja negra y defensa ligera.