Identificación de la Pérdida de Clientes Considerando la Minería de Casos Difíciles
Autores: Li, Jianfeng; Bai, Xue; Xu, Qian; Yang, Dexiang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Identificación de la Pérdida de Clientes Considerando la Minería de Casos Difíciles
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Modelo de abandono de usuarios
Desequilibrio
Modelos de clasificación
Pérdida Focal
Minería de ejemplos difíciles
LightGBM
Identificación
Clientes
Que abandonan
Costo de mala clasificación
Muestras de clase minoritaria
Conjunto de datos
Usuarios de tarjetas de crédito
AUC
TPR
índice G-mean
Estabilidad
Usuarios potencialmente perdidos.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
En el proceso de modelado de abandono de usuarios, debido al desequilibrio entre los usuarios perdidos y los usuarios retenidos, el uso de modelos de clasificación tradicionales a menudo no puede identificar de manera precisa y completa a los usuarios con tendencia a abandonar. Para abordar este problema, no es suficiente simplemente aumentar el costo de clasificación errónea de las muestras de la clase minoritaria en métodos sensibles al costo. Este documento propone utilizar la técnica de minería de ejemplos difíciles Focal Loss para añadir el peso de clase alfa y el parámetro de enfoque a la función de pérdida de entropía cruzada de LightGBM. Además, enfatiza la identificación de clientes en riesgo de abandono y aumenta el costo de clasificación errónea para muestras minoritarias y difíciles de clasificar. Sobre la base de las ideas anteriores, se propone el modelo FocalLoss_LightGBM, junto con bosques aleatorios, SVM, XGBoost y LightGBM. El análisis empírico se basa en un conjunto de datos de usuarios de tarjetas de crédito disponible públicamente en el sitio web de Kaggle. Los valores de los índices AUC, TPR y G-mean fueron superiores al modelo existente, lo que puede mejorar efectivamente la precisión y estabilidad de los usuarios potencialmente perdidos.
Descripción
En el proceso de modelado de abandono de usuarios, debido al desequilibrio entre los usuarios perdidos y los usuarios retenidos, el uso de modelos de clasificación tradicionales a menudo no puede identificar de manera precisa y completa a los usuarios con tendencia a abandonar. Para abordar este problema, no es suficiente simplemente aumentar el costo de clasificación errónea de las muestras de la clase minoritaria en métodos sensibles al costo. Este documento propone utilizar la técnica de minería de ejemplos difíciles Focal Loss para añadir el peso de clase alfa y el parámetro de enfoque a la función de pérdida de entropía cruzada de LightGBM. Además, enfatiza la identificación de clientes en riesgo de abandono y aumenta el costo de clasificación errónea para muestras minoritarias y difíciles de clasificar. Sobre la base de las ideas anteriores, se propone el modelo FocalLoss_LightGBM, junto con bosques aleatorios, SVM, XGBoost y LightGBM. El análisis empírico se basa en un conjunto de datos de usuarios de tarjetas de crédito disponible públicamente en el sitio web de Kaggle. Los valores de los índices AUC, TPR y G-mean fueron superiores al modelo existente, lo que puede mejorar efectivamente la precisión y estabilidad de los usuarios potencialmente perdidos.