logo móvil
Contáctanos

Un Marco Generalizado para la Detección y Prevención de Ataques Adversariales Usando Grad-CAM y Técnicas de Agrupamiento

Autores: Sim, Jeong-Hyun; Song, Hyun-Min

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Un Marco Generalizado para la Detección y Prevención de Ataques Adversariales Usando Grad-CAM y Técnicas de Agrupamiento


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Avances
Tecnología de visión por computadora basada en IA
Modelos de clasificación de imágenes
Ataques adversariales
Métodos de detección
Redes neuronales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 17

Citaciones: Sin citaciones


Descripción
A través de avances en la tecnología de visión por computadora basada en IA, el rendimiento de los modelos modernos de clasificación de imágenes ha superado la percepción humana, lo que los hace valiosos en diversos campos. Sin embargo, los ataques adversariales, que implican pequeños cambios en las imágenes que son difíciles de percibir para los humanos, pueden hacer que los modelos de clasificación clasifiquen incorrectamente las imágenes. Considerando la disponibilidad de modelos de clasificación que utilizan redes neuronales, es crucial prevenir ataques adversariales. Los métodos de detección recientes son efectivos solo para ataques específicos o no se pueden aplicar a varios modelos. Por lo tanto, en este artículo, propusimos un método basado en un mecanismo de atención para detectar ataques adversariales. Utilizamos un marco que emplea un modelo de conjunto, Grad-CAM y calculamos el coeficiente de silueta para la detección. Aplicamos este método a los modelos de clasificación Resnet18, Mobilenetv2 y VGG16 que fueron ajustados en el conjunto de datos CIFAR-10. El rendimiento promedio demostró que Mobilenetv2 logró un F1-Score de 0.9022 y una precisión de 0.9103, Resnet18 logró un F1-Score de 0.9124 y una precisión de 0.9302, y VGG16 logró un F1-Score de 0.9185 y una precisión de 0.9252. Los resultados demostraron que nuestro método no solo detecta, sino que también previene ataques adversariales al mitigar sus efectos y restaurar etiquetas de manera efectiva.

Otros recursos que podrían interesarte

Temas Virtualpro