Ensamble de Aprendizaje Amplio Multi-Vista Robusto para Clasificación Semi-Supervisada
Autores: Dong, Ziyang; Lin, Mianfen; Yu, Zhiwen
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Ensamble de Aprendizaje Amplio Multi-Vista Robusto para Clasificación Semi-Supervisada
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje semi-supervisado
M2C-SSBLS
Extensión de conjunto
Criterio de correntropía de mezcla máxima
Robustez
Estructura de variedad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En escenarios de aprendizaje semi-supervisado, la presencia de datos etiquetados limitados y abundantes muestras no etiquetadas plantea desafíos significativos para la robustez y generalización del modelo. Aunque el sistema de aprendizaje amplio semi-supervisado (SSBLS) explota eficazmente la estructura de variedades a través de la regularización del Laplaciano gráfico, su optimización se formula típicamente bajo el criterio de error cuadrático medio (MSE), que es sensible al ruido y a los valores atípicos. Para abordar esta limitación, este artículo introduce el criterio de correntropía de mezcla máxima (MMC) en el marco de SSBLS y propone un modelo denominado M2C-SSBLS. Al reemplazar la pérdida MSE convencional por un objetivo basado en correntropía de mezcla, el método propuesto mejora la robustez contra el ruido no gaussiano y muestras anormales, al tiempo que preserva la eficiencia computacional y la propiedad de solución analítica del BLS. Además, para mejorar la diversidad de representación y reducir la varianza del modelo, se propone una extensión de conjunto de múltiples vistas, llamada EC-SSBLS. Este método construye múltiples vistas de características a través de una estrategia de subespacio de características aleatorias y entrena de manera independiente un aprendiz base M2C-SSBLS en cada subespacio. Finalmente, los resultados predichos de cada vista se fusionan a través de un mecanismo de votación. Los experimentos en conjuntos de datos de referencia de UCI bajo configuraciones sin ruido, con un 10% y un 20% de ruido en las etiquetas demuestran que el M2C-SSBLS propuesto supera consistentemente al SSBLS convencional y a otros enfoques avanzados de aprendizaje semi-supervisado. La extensión de conjunto EC-SSBLS mejora aún más el rendimiento, particularmente en entornos ruidosos, validando la efectividad de combinar la optimización basada en MMC con el aprendizaje de conjunto de múltiples vistas.
Descripción
En escenarios de aprendizaje semi-supervisado, la presencia de datos etiquetados limitados y abundantes muestras no etiquetadas plantea desafíos significativos para la robustez y generalización del modelo. Aunque el sistema de aprendizaje amplio semi-supervisado (SSBLS) explota eficazmente la estructura de variedades a través de la regularización del Laplaciano gráfico, su optimización se formula típicamente bajo el criterio de error cuadrático medio (MSE), que es sensible al ruido y a los valores atípicos. Para abordar esta limitación, este artículo introduce el criterio de correntropía de mezcla máxima (MMC) en el marco de SSBLS y propone un modelo denominado M2C-SSBLS. Al reemplazar la pérdida MSE convencional por un objetivo basado en correntropía de mezcla, el método propuesto mejora la robustez contra el ruido no gaussiano y muestras anormales, al tiempo que preserva la eficiencia computacional y la propiedad de solución analítica del BLS. Además, para mejorar la diversidad de representación y reducir la varianza del modelo, se propone una extensión de conjunto de múltiples vistas, llamada EC-SSBLS. Este método construye múltiples vistas de características a través de una estrategia de subespacio de características aleatorias y entrena de manera independiente un aprendiz base M2C-SSBLS en cada subespacio. Finalmente, los resultados predichos de cada vista se fusionan a través de un mecanismo de votación. Los experimentos en conjuntos de datos de referencia de UCI bajo configuraciones sin ruido, con un 10% y un 20% de ruido en las etiquetas demuestran que el M2C-SSBLS propuesto supera consistentemente al SSBLS convencional y a otros enfoques avanzados de aprendizaje semi-supervisado. La extensión de conjunto EC-SSBLS mejora aún más el rendimiento, particularmente en entornos ruidosos, validando la efectividad de combinar la optimización basada en MMC con el aprendizaje de conjunto de múltiples vistas.