Un enfoque en muestras importantes para la detección fuera de distribución
Autores: Wan, Jiaqi; Wen, Guoliang; Sun, Guangming; Zhu, Yuntian; Hu, Zhaohui
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un enfoque en muestras importantes para la detección fuera de distribución
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Fiabilidad
Seguridad
Aprendizaje automático
Detección de OOD
FIS
Entrenamiento de modelos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Para garantizar la fiabilidad y seguridad de los modelos de clasificación de aprendizaje automático cuando se implementan en el mundo real, es crucial que estos modelos puedan detectar datos fuera de distribución (OOD) que presenten cambios semánticos respecto a los datos de distribución (ID) utilizados durante el entrenamiento. Esta necesidad ha impulsado una extensa investigación sobre la detección de OOD. Métodos anteriores requerían una gran cantidad de datos OOD finamente etiquetados para el entrenamiento del modelo, lo cual es costoso o tenía un rendimiento deficiente en escenarios del mundo real. Para abordar estas limitaciones, proponemos un método novedoso llamado (FIS) en este documento. FIS aprovecha las puntuaciones OOD predichas por el modelo para identificar y centrarse en muestras importantes que son más beneficiosas para el entrenamiento del modelo. Al aprender de estas muestras importantes, nuestro método tiene como objetivo lograr un rendimiento fiable en la detección de OOD, al tiempo que reduce los costos de entrenamiento y el riesgo de sobreajuste de los datos de entrenamiento, lo que permite al modelo distinguir mejor entre datos ID y OOD. Experimentos extensos en diversos escenarios de detección de OOD demuestran que FIS logra un rendimiento superior en comparación con enfoques existentes, destacando su rendimiento robusto y eficiente en la detección de OOD en aplicaciones prácticas.
Descripción
Para garantizar la fiabilidad y seguridad de los modelos de clasificación de aprendizaje automático cuando se implementan en el mundo real, es crucial que estos modelos puedan detectar datos fuera de distribución (OOD) que presenten cambios semánticos respecto a los datos de distribución (ID) utilizados durante el entrenamiento. Esta necesidad ha impulsado una extensa investigación sobre la detección de OOD. Métodos anteriores requerían una gran cantidad de datos OOD finamente etiquetados para el entrenamiento del modelo, lo cual es costoso o tenía un rendimiento deficiente en escenarios del mundo real. Para abordar estas limitaciones, proponemos un método novedoso llamado (FIS) en este documento. FIS aprovecha las puntuaciones OOD predichas por el modelo para identificar y centrarse en muestras importantes que son más beneficiosas para el entrenamiento del modelo. Al aprender de estas muestras importantes, nuestro método tiene como objetivo lograr un rendimiento fiable en la detección de OOD, al tiempo que reduce los costos de entrenamiento y el riesgo de sobreajuste de los datos de entrenamiento, lo que permite al modelo distinguir mejor entre datos ID y OOD. Experimentos extensos en diversos escenarios de detección de OOD demuestran que FIS logra un rendimiento superior en comparación con enfoques existentes, destacando su rendimiento robusto y eficiente en la detección de OOD en aplicaciones prácticas.