RegCGAN: remuestreo con CGAN regularizado para el problema de datos grandes desequilibrados
Autores: Xu, Liwen; Wang, Ximeng
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
RegCGAN: remuestreo con CGAN regularizado para el problema de datos grandes desequilibrados
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Modelos basados en remuestreo
Redes generativas adversarias condicionales
Enfoque de regularización de entropía
Aprendizaje de datos desequilibrados
Punto de equilibrio
Predicción de la clase minoritaria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Consideramos el problema de datos desequilibrados que implica una nueva clase de modelos basados en remuestreo para clasificación. Estos modelos son variantes de las redes generativas adversarias condicionales. Se emplea un enfoque de regularización de entropía (RegCGAN) para implementar el aprendizaje de datos desequilibrados correspondiente. Se introduce su marco básico. Se realizan análisis teóricos y basados en simulaciones para demostrar la existencia y unicidad del punto de equilibrio de RegCGAN, y RegCGAN tiene una excelente capacidad de predicción de la clase minoritaria. Aplicamos los resultados a dos conjuntos de datos desequilibrados construidos sintéticamente y a un conjunto de datos desequilibrados reales.
Descripción
Consideramos el problema de datos desequilibrados que implica una nueva clase de modelos basados en remuestreo para clasificación. Estos modelos son variantes de las redes generativas adversarias condicionales. Se emplea un enfoque de regularización de entropía (RegCGAN) para implementar el aprendizaje de datos desequilibrados correspondiente. Se introduce su marco básico. Se realizan análisis teóricos y basados en simulaciones para demostrar la existencia y unicidad del punto de equilibrio de RegCGAN, y RegCGAN tiene una excelente capacidad de predicción de la clase minoritaria. Aplicamos los resultados a dos conjuntos de datos desequilibrados construidos sintéticamente y a un conjunto de datos desequilibrados reales.