Desigualdad de valor absoluto SVM para el problema de aprendizaje PU
Autores: Yuan, Yongjia; Bai, Fusheng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Desigualdad de valor absoluto SVM para el problema de aprendizaje PU
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Significativo
Clasificación binaria
Aprendizaje automático
Ejemplos positivos
Datos no etiquetados
Clasificadores
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
El aprendizaje positivo y no etiquetado (aprendizaje PU) es una tarea significativa de clasificación binaria en el aprendizaje automático; se centra en entrenar clasificadores precisos utilizando datos positivos y datos no etiquetados. La mayoría de los trabajos en esta área se basan en una estrategia de dos pasos: el primer paso es identificar ejemplos negativos confiables a partir de ejemplos no etiquetados, y el segundo paso es construir los clasificadores basándose en los ejemplos positivos y los ejemplos negativos confiables identificados utilizando métodos de aprendizaje supervisado. Sin embargo, estos métodos siempre subutilizan los datos no etiquetados restantes, lo que limita el rendimiento del aprendizaje PU. Además, muchos métodos requieren la solución iterativa de los problemas de programación cuadrática formulados para obtener el clasificador final, lo que resulta en un alto costo computacional. En este artículo, proponemos un nuevo método llamado máquina de vectores de soporte de desigualdad de valor absoluto, que aplica el concepto de excentricidad para seleccionar ejemplos negativos confiables de los datos no etiquetados y luego construye un clasificador basado en los ejemplos positivos, los ejemplos negativos seleccionados y los datos no etiquetados restantes. Además, aplicamos una técnica de optimización de hiperparámetros para buscar y seleccionar automáticamente los valores de parámetros óptimos en el algoritmo propuesto. Los resultados experimentales numéricos en diez conjuntos de datos del mundo real demuestran que nuestro método es mejor que los otros tres algoritmos de referencia.
Descripción
El aprendizaje positivo y no etiquetado (aprendizaje PU) es una tarea significativa de clasificación binaria en el aprendizaje automático; se centra en entrenar clasificadores precisos utilizando datos positivos y datos no etiquetados. La mayoría de los trabajos en esta área se basan en una estrategia de dos pasos: el primer paso es identificar ejemplos negativos confiables a partir de ejemplos no etiquetados, y el segundo paso es construir los clasificadores basándose en los ejemplos positivos y los ejemplos negativos confiables identificados utilizando métodos de aprendizaje supervisado. Sin embargo, estos métodos siempre subutilizan los datos no etiquetados restantes, lo que limita el rendimiento del aprendizaje PU. Además, muchos métodos requieren la solución iterativa de los problemas de programación cuadrática formulados para obtener el clasificador final, lo que resulta en un alto costo computacional. En este artículo, proponemos un nuevo método llamado máquina de vectores de soporte de desigualdad de valor absoluto, que aplica el concepto de excentricidad para seleccionar ejemplos negativos confiables de los datos no etiquetados y luego construye un clasificador basado en los ejemplos positivos, los ejemplos negativos seleccionados y los datos no etiquetados restantes. Además, aplicamos una técnica de optimización de hiperparámetros para buscar y seleccionar automáticamente los valores de parámetros óptimos en el algoritmo propuesto. Los resultados experimentales numéricos en diez conjuntos de datos del mundo real demuestran que nuestro método es mejor que los otros tres algoritmos de referencia.