Sobremuestreo Adaptativo a través de Estimación de Densidad para Clasificación Desbalanceada en Línea
Autores: Lee, Daeun; Kim, Hyunjoong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Sobremuestreo Adaptativo a través de Estimación de Densidad para Clasificación Desbalanceada en Línea
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje en línea
Datos secuenciales
Cambio de concepto
Desequilibrio de clases
Estimación de densidad de núcleo ponderado adaptativo
Clases minoritarias
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El aprendizaje en línea es un marco para procesar y aprender de datos secuenciales en tiempo real, ofreciendo beneficios como la prontitud y un bajo uso de memoria. Sin embargo, enfrenta desafíos críticos, incluyendo el cambio de concepto, donde las distribuciones de datos evolucionan con el tiempo, y el desequilibrio de clases, que dificulta significativamente la clasificación precisa de las clases minoritarias. Abordar estos problemas simultáneamente sigue siendo un desafío en la investigación. Este estudio introduce un nuevo algoritmo que integra la estimación de densidad de núcleo ponderada adaptativa (awKDE) y un mecanismo de sesgo consciente para gestionar eficientemente la memoria, mientras mejora el rendimiento de clasificación. El método propuesto detecta dinámicamente la clase minoritaria y emplea una estrategia de sesgo para priorizar su representación durante el entrenamiento. Al generar muestras sintéticas de la minoría utilizando awKDE, el algoritmo equilibra adaptativamente las distribuciones de clases, asegurando robustez en entornos en evolución. Las evaluaciones experimentales en conjuntos de datos sintéticos y del mundo real demostraron que el método propuesto logró hasta un 13.3 veces de mejora en el rendimiento de clasificación en comparación con métodos de sobremuestreo establecidos y hasta un 1.66 veces mejor rendimiento en comparación con enfoques de reequilibrio adaptativo, mientras requería significativamente menos memoria. Estos resultados subrayan la escalabilidad y la practicidad del método para aplicaciones de aprendizaje en línea en tiempo real.
Descripción
El aprendizaje en línea es un marco para procesar y aprender de datos secuenciales en tiempo real, ofreciendo beneficios como la prontitud y un bajo uso de memoria. Sin embargo, enfrenta desafíos críticos, incluyendo el cambio de concepto, donde las distribuciones de datos evolucionan con el tiempo, y el desequilibrio de clases, que dificulta significativamente la clasificación precisa de las clases minoritarias. Abordar estos problemas simultáneamente sigue siendo un desafío en la investigación. Este estudio introduce un nuevo algoritmo que integra la estimación de densidad de núcleo ponderada adaptativa (awKDE) y un mecanismo de sesgo consciente para gestionar eficientemente la memoria, mientras mejora el rendimiento de clasificación. El método propuesto detecta dinámicamente la clase minoritaria y emplea una estrategia de sesgo para priorizar su representación durante el entrenamiento. Al generar muestras sintéticas de la minoría utilizando awKDE, el algoritmo equilibra adaptativamente las distribuciones de clases, asegurando robustez en entornos en evolución. Las evaluaciones experimentales en conjuntos de datos sintéticos y del mundo real demostraron que el método propuesto logró hasta un 13.3 veces de mejora en el rendimiento de clasificación en comparación con métodos de sobremuestreo establecidos y hasta un 1.66 veces mejor rendimiento en comparación con enfoques de reequilibrio adaptativo, mientras requería significativamente menos memoria. Estos resultados subrayan la escalabilidad y la practicidad del método para aplicaciones de aprendizaje en línea en tiempo real.