Aproximación y Proyección de Variedades Uniformes Filtrado e Inteligencia Artificial Explicable para Detectar Aprendizaje Automático Adversarial
Autores: Koroma, Achmed Samuel; Narteni, Sara; Cambiaso, Enrico; Mongelli, Maurizio
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aproximación y Proyección de Variedades Uniformes Filtrado e Inteligencia Artificial Explicable para Detectar Aprendizaje Automático Adversarial
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje automático adversarial
Inteligencia artificial
UMAP
Reglas de decisión
IA explicable
Comportamiento de ataques
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El aprendizaje automático adversarial explota las vulnerabilidades de los modelos de inteligencia artificial (IA) al inducir distorsiones maliciosas en los datos de entrada. Comenzando con el efecto de los métodos adversariales en los conocidos conjuntos de datos abiertos MNIST y CIFAR-10, este artículo investiga la capacidad de la Aproximación y Proyección de Variedades Uniformes (UMAP) para proporcionar representaciones útiles tanto de imágenes legítimas como maliciosas y analiza el comportamiento de los ataques bajo diversas condiciones. Al permitir la extracción de reglas de decisión y la clasificación de características importantes de clasificadores como los árboles de decisión, la IA Explicable (XAI) logra cero falsos positivos y negativos en la detección a través de reglas muy simples de si-entonces sobre las variables de UMAP. Se informan varios ejemplos para resaltar el comportamiento de los ataques. La declaración de disponibilidad de datos detalla todo el código y los datos que están disponibles públicamente para ofrecer apoyo a la reproducibilidad.
Descripción
El aprendizaje automático adversarial explota las vulnerabilidades de los modelos de inteligencia artificial (IA) al inducir distorsiones maliciosas en los datos de entrada. Comenzando con el efecto de los métodos adversariales en los conocidos conjuntos de datos abiertos MNIST y CIFAR-10, este artículo investiga la capacidad de la Aproximación y Proyección de Variedades Uniformes (UMAP) para proporcionar representaciones útiles tanto de imágenes legítimas como maliciosas y analiza el comportamiento de los ataques bajo diversas condiciones. Al permitir la extracción de reglas de decisión y la clasificación de características importantes de clasificadores como los árboles de decisión, la IA Explicable (XAI) logra cero falsos positivos y negativos en la detección a través de reglas muy simples de si-entonces sobre las variables de UMAP. Se informan varios ejemplos para resaltar el comportamiento de los ataques. La declaración de disponibilidad de datos detalla todo el código y los datos que están disponibles públicamente para ofrecer apoyo a la reproducibilidad.