Un enfoque de vecino más cercano basado en información de Hubness para el aprendizaje multi-etiqueta
Autores: Teng, Zeyu; Tang, Shanshan; Huang, Min; Wang, Xingwei
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un enfoque de vecino más cercano basado en información de Hubness para el aprendizaje multi-etiqueta
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Clasificación multi-etiqueta
Hubness
Vecino más cercano k
MLHiKNN
Medida difusa
Regresión logística
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
La clasificación multi-etiqueta (MLC) juega un papel crucial en varios escenarios del mundo real. La predicción con vecinos más cercanos ha logrado un rendimiento competitivo en MLC. El fenómeno de hubness, en el cual algunos puntos aparecen en las listas de vecinos más cercanos (kNN) de muchos puntos en espacios de alta dimensión, puede impactar significativamente las aplicaciones de aprendizaje automático y ha atraído recientemente una atención extensa. Sin embargo, no ha sido abordado adecuadamente en el desarrollo de algoritmos MLC. Para abordar este problema, proponemos un algoritmo MLC basado en kNN consciente de hubness en este documento, llamado vecino más cercano basado en información de hubness multi-etiqueta (MLHiKNN). Específicamente, introducimos una medida difusa de relevancia de etiqueta y empleamos un esquema kNN ponderado. La información de hubness se utiliza para calcular la membresía de cada ejemplo de entrenamiento en relevancia e irrelevancia para cada etiqueta y calcular pesos para los vecinos más cercanos de un punto de consulta. Luego, MLHiKNN explota las correlaciones de etiquetas de alto orden al entrenar un modelo de regresión logística para cada etiqueta utilizando los resultados de votación de kNN con respecto a todas las etiquetas posibles. Los resultados experimentales en 28 conjuntos de datos de referencia demuestran que MLHiKNN es competitivo entre los métodos comparados, incluidos nueve algoritmos MLC bien establecidos y tres técnicas comúnmente utilizadas de reducción de hubness, para abordar problemas de MLC.
Descripción
La clasificación multi-etiqueta (MLC) juega un papel crucial en varios escenarios del mundo real. La predicción con vecinos más cercanos ha logrado un rendimiento competitivo en MLC. El fenómeno de hubness, en el cual algunos puntos aparecen en las listas de vecinos más cercanos (kNN) de muchos puntos en espacios de alta dimensión, puede impactar significativamente las aplicaciones de aprendizaje automático y ha atraído recientemente una atención extensa. Sin embargo, no ha sido abordado adecuadamente en el desarrollo de algoritmos MLC. Para abordar este problema, proponemos un algoritmo MLC basado en kNN consciente de hubness en este documento, llamado vecino más cercano basado en información de hubness multi-etiqueta (MLHiKNN). Específicamente, introducimos una medida difusa de relevancia de etiqueta y empleamos un esquema kNN ponderado. La información de hubness se utiliza para calcular la membresía de cada ejemplo de entrenamiento en relevancia e irrelevancia para cada etiqueta y calcular pesos para los vecinos más cercanos de un punto de consulta. Luego, MLHiKNN explota las correlaciones de etiquetas de alto orden al entrenar un modelo de regresión logística para cada etiqueta utilizando los resultados de votación de kNN con respecto a todas las etiquetas posibles. Los resultados experimentales en 28 conjuntos de datos de referencia demuestran que MLHiKNN es competitivo entre los métodos comparados, incluidos nueve algoritmos MLC bien establecidos y tres técnicas comúnmente utilizadas de reducción de hubness, para abordar problemas de MLC.