Perturbación de pesos consciente de la geometría para entrenamiento adversarial
Autores: Jiang, Yixuan; Chiang, Hsiao-Dong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Perturbación de pesos consciente de la geometría para entrenamiento adversarial
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Entrenamiento adversarial
Robustez del modelo
Métodos conscientes de la geometría
Límite de decisión
Ataques adversariales
Perturbación de peso
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
El entrenamiento adversarial es uno de los enfoques más exitosos para mejorar la robustez del modelo frente a datos manipulados maliciosamente. En lugar de entrenar con un conjunto de datos limpio, el modelo se entrena con datos adversarios generados al vuelo. Basándose en eso, se proponen un grupo de métodos conscientes de la geometría para mejorar aún más la robustez del modelo asignando mayores pesos a los puntos de datos que están más cerca del límite de decisión durante el entrenamiento. Aunque la robustez frente al ataque adversario visto en el proceso de entrenamiento mejora significativamente, el modelo se vuelve más vulnerable a ataques no vistos, y la razón de este problema sigue sin estar clara. En este documento, investigamos la causa del problema y afirmamos que tales métodos conscientes de la geometría conducen a un mínimo agudo, lo que resulta en una mala generalización de la robustez para ataques no vistos. Además, proponemos un remedio para el problema mediante la imposición del mecanismo de perturbación de peso adversario y desarrollamos aún más una estrategia de perturbación de peso novedosa llamada Perturbación de Peso Consciente de la Geometría (GAWP). Los resultados extensos demuestran que el método propuesto alivia el problema de generalización de la robustez de los métodos conscientes de la geometría mientras mejora consistentemente la robustez del modelo en comparación con las estrategias de perturbación de peso existentes.
Descripción
El entrenamiento adversarial es uno de los enfoques más exitosos para mejorar la robustez del modelo frente a datos manipulados maliciosamente. En lugar de entrenar con un conjunto de datos limpio, el modelo se entrena con datos adversarios generados al vuelo. Basándose en eso, se proponen un grupo de métodos conscientes de la geometría para mejorar aún más la robustez del modelo asignando mayores pesos a los puntos de datos que están más cerca del límite de decisión durante el entrenamiento. Aunque la robustez frente al ataque adversario visto en el proceso de entrenamiento mejora significativamente, el modelo se vuelve más vulnerable a ataques no vistos, y la razón de este problema sigue sin estar clara. En este documento, investigamos la causa del problema y afirmamos que tales métodos conscientes de la geometría conducen a un mínimo agudo, lo que resulta en una mala generalización de la robustez para ataques no vistos. Además, proponemos un remedio para el problema mediante la imposición del mecanismo de perturbación de peso adversario y desarrollamos aún más una estrategia de perturbación de peso novedosa llamada Perturbación de Peso Consciente de la Geometría (GAWP). Los resultados extensos demuestran que el método propuesto alivia el problema de generalización de la robustez de los métodos conscientes de la geometría mientras mejora consistentemente la robustez del modelo en comparación con las estrategias de perturbación de peso existentes.