Un Marco Generalizado para la Detección y Prevención de Ataques Adversariales Usando Grad-CAM y Técnicas de Agrupamiento
Autores: Sim, Jeong-Hyun; Song, Hyun-Min
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un Marco Generalizado para la Detección y Prevención de Ataques Adversariales Usando Grad-CAM y Técnicas de Agrupamiento
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Avances
Tecnología de visión por computadora basada en IA
Modelos de clasificación de imágenes
Ataques adversariales
Métodos de detección
Redes neuronales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
A través de avances en la tecnología de visión por computadora basada en IA, el rendimiento de los modelos modernos de clasificación de imágenes ha superado la percepción humana, lo que los hace valiosos en diversos campos. Sin embargo, los ataques adversariales, que implican pequeños cambios en las imágenes que son difíciles de percibir para los humanos, pueden hacer que los modelos de clasificación clasifiquen incorrectamente las imágenes. Considerando la disponibilidad de modelos de clasificación que utilizan redes neuronales, es crucial prevenir ataques adversariales. Los métodos de detección recientes son efectivos solo para ataques específicos o no se pueden aplicar a varios modelos. Por lo tanto, en este artículo, propusimos un método basado en un mecanismo de atención para detectar ataques adversariales. Utilizamos un marco que emplea un modelo de conjunto, Grad-CAM y calculamos el coeficiente de silueta para la detección. Aplicamos este método a los modelos de clasificación Resnet18, Mobilenetv2 y VGG16 que fueron ajustados en el conjunto de datos CIFAR-10. El rendimiento promedio demostró que Mobilenetv2 logró un F1-Score de 0.9022 y una precisión de 0.9103, Resnet18 logró un F1-Score de 0.9124 y una precisión de 0.9302, y VGG16 logró un F1-Score de 0.9185 y una precisión de 0.9252. Los resultados demostraron que nuestro método no solo detecta, sino que también previene ataques adversariales al mitigar sus efectos y restaurar etiquetas de manera efectiva.
Descripción
A través de avances en la tecnología de visión por computadora basada en IA, el rendimiento de los modelos modernos de clasificación de imágenes ha superado la percepción humana, lo que los hace valiosos en diversos campos. Sin embargo, los ataques adversariales, que implican pequeños cambios en las imágenes que son difíciles de percibir para los humanos, pueden hacer que los modelos de clasificación clasifiquen incorrectamente las imágenes. Considerando la disponibilidad de modelos de clasificación que utilizan redes neuronales, es crucial prevenir ataques adversariales. Los métodos de detección recientes son efectivos solo para ataques específicos o no se pueden aplicar a varios modelos. Por lo tanto, en este artículo, propusimos un método basado en un mecanismo de atención para detectar ataques adversariales. Utilizamos un marco que emplea un modelo de conjunto, Grad-CAM y calculamos el coeficiente de silueta para la detección. Aplicamos este método a los modelos de clasificación Resnet18, Mobilenetv2 y VGG16 que fueron ajustados en el conjunto de datos CIFAR-10. El rendimiento promedio demostró que Mobilenetv2 logró un F1-Score de 0.9022 y una precisión de 0.9103, Resnet18 logró un F1-Score de 0.9124 y una precisión de 0.9302, y VGG16 logró un F1-Score de 0.9185 y una precisión de 0.9252. Los resultados demostraron que nuestro método no solo detecta, sino que también previene ataques adversariales al mitigar sus efectos y restaurar etiquetas de manera efectiva.