Validación adversarial en conjuntos de datos de clasificación de imágenes mediante el gradiente espectral acumulativo
Autores: Renza, Diego; Moya-Albor, Ernesto; Chavarro, Adrian
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Validación adversarial en conjuntos de datos de clasificación de imágenes mediante el gradiente espectral acumulativo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aprendizaje automático
Modelo entrenado
Predicciones
Cambio de distribución
Conjuntos de datos
Complejidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El objetivo principal de un sistema de aprendizaje automático (ML) es obtener un modelo entrenado a partir de datos de entrada de tal manera que permita hacer predicciones sobre nuevos datos (Independientemente e Idénticamente Distribuidos) con el menor error posible. Sin embargo, ¿cómo podemos evaluar si los datos de entrenamiento y prueba tienen una distribución similar? Para responder a esta pregunta, este documento presenta una propuesta para determinar el grado de cambio de distribución de dos conjuntos de datos. Para ello, se utiliza una métrica para evaluar la complejidad en los conjuntos de datos, que se puede aplicar en problemas de múltiples clases, comparando cada par de clases de los dos conjuntos. La metodología propuesta se ha aplicado a tres conjuntos de datos conocidos: MNIST, CIFAR-10 y CIFAR-100, junto con versiones corruptas de estos. A través de esta metodología, es posible evaluar qué tipos de modificaciones tienen un mayor impacto en la generalización de los modelos sin la necesidad de entrenar múltiples modelos varias veces, permitiéndonos también determinar qué clases se ven más afectadas por la corrupción.
Descripción
El objetivo principal de un sistema de aprendizaje automático (ML) es obtener un modelo entrenado a partir de datos de entrada de tal manera que permita hacer predicciones sobre nuevos datos (Independientemente e Idénticamente Distribuidos) con el menor error posible. Sin embargo, ¿cómo podemos evaluar si los datos de entrenamiento y prueba tienen una distribución similar? Para responder a esta pregunta, este documento presenta una propuesta para determinar el grado de cambio de distribución de dos conjuntos de datos. Para ello, se utiliza una métrica para evaluar la complejidad en los conjuntos de datos, que se puede aplicar en problemas de múltiples clases, comparando cada par de clases de los dos conjuntos. La metodología propuesta se ha aplicado a tres conjuntos de datos conocidos: MNIST, CIFAR-10 y CIFAR-100, junto con versiones corruptas de estos. A través de esta metodología, es posible evaluar qué tipos de modificaciones tienen un mayor impacto en la generalización de los modelos sin la necesidad de entrenar múltiples modelos varias veces, permitiéndonos también determinar qué clases se ven más afectadas por la corrupción.