logo móvil
Contáctanos

Sobremuestreo Adaptativo a través de Estimación de Densidad para Clasificación Desbalanceada en Línea

Autores: Lee, Daeun; Kim, Hyunjoong

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Sobremuestreo Adaptativo a través de Estimación de Densidad para Clasificación Desbalanceada en Línea


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Aprendizaje en línea
Datos secuenciales
Cambio de concepto
Desequilibrio de clases
Estimación de densidad de núcleo ponderado adaptativo
Clases minoritarias

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El aprendizaje en línea es un marco para procesar y aprender de datos secuenciales en tiempo real, ofreciendo beneficios como la prontitud y un bajo uso de memoria. Sin embargo, enfrenta desafíos críticos, incluyendo el cambio de concepto, donde las distribuciones de datos evolucionan con el tiempo, y el desequilibrio de clases, que dificulta significativamente la clasificación precisa de las clases minoritarias. Abordar estos problemas simultáneamente sigue siendo un desafío en la investigación. Este estudio introduce un nuevo algoritmo que integra la estimación de densidad de núcleo ponderada adaptativa (awKDE) y un mecanismo de sesgo consciente para gestionar eficientemente la memoria, mientras mejora el rendimiento de clasificación. El método propuesto detecta dinámicamente la clase minoritaria y emplea una estrategia de sesgo para priorizar su representación durante el entrenamiento. Al generar muestras sintéticas de la minoría utilizando awKDE, el algoritmo equilibra adaptativamente las distribuciones de clases, asegurando robustez en entornos en evolución. Las evaluaciones experimentales en conjuntos de datos sintéticos y del mundo real demostraron que el método propuesto logró hasta un 13.3 veces de mejora en el rendimiento de clasificación en comparación con métodos de sobremuestreo establecidos y hasta un 1.66 veces mejor rendimiento en comparación con enfoques de reequilibrio adaptativo, mientras requería significativamente menos memoria. Estos resultados subrayan la escalabilidad y la practicidad del método para aplicaciones de aprendizaje en línea en tiempo real.

Otros recursos que podrían interesarte

Temas Virtualpro