Fortalecer al guardián, no al tesoro: detectores adversariales resilientes
Autores: Lapid, Raz; Dubin, Almog; Sipper, Moshe
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Fortalecer al guardián, no al tesoro: detectores adversariales resilientes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Adaptativo
Ataques adversarios
Radar
Robusto
Detección
Reentrenamiento adversarial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Los ataques adversarios adaptativos, donde los adversarios adaptan sus estrategias con pleno conocimiento de los mecanismos de defensa, plantean desafíos significativos para la robustez de los detectores adversarios. En este documento, presentamos RADAR (Detección Adversaria Robusta a través de Reentrenamiento Adversarial), un enfoque diseñado para fortalecer los detectores adversarios contra tales ataques adaptativos mientras se preserva la precisión del clasificador. RADAR emplea el entrenamiento adversario al incorporar ejemplos adversarios, diseñados para engañar tanto al clasificador como al detector, en el proceso de entrenamiento. Esta optimización dual permite que el detector aprenda y se adapte a escenarios de ataque sofisticados. Experimentos exhaustivos en los conjuntos de datos CIFAR-10, SVHN e ImageNet demuestran que RADAR mejora sustancialmente la capacidad del detector para identificar con precisión los ataques adversarios adaptativos sin degradar el rendimiento del clasificador.
Descripción
Los ataques adversarios adaptativos, donde los adversarios adaptan sus estrategias con pleno conocimiento de los mecanismos de defensa, plantean desafíos significativos para la robustez de los detectores adversarios. En este documento, presentamos RADAR (Detección Adversaria Robusta a través de Reentrenamiento Adversarial), un enfoque diseñado para fortalecer los detectores adversarios contra tales ataques adaptativos mientras se preserva la precisión del clasificador. RADAR emplea el entrenamiento adversario al incorporar ejemplos adversarios, diseñados para engañar tanto al clasificador como al detector, en el proceso de entrenamiento. Esta optimización dual permite que el detector aprenda y se adapte a escenarios de ataque sofisticados. Experimentos exhaustivos en los conjuntos de datos CIFAR-10, SVHN e ImageNet demuestran que RADAR mejora sustancialmente la capacidad del detector para identificar con precisión los ataques adversarios adaptativos sin degradar el rendimiento del clasificador.