Predicción de Incumplimiento de Tarjetas de Crédito: Un Análisis Empírico sobre el Rendimiento Predictivo Utilizando Métodos Estadísticos y de Aprendizaje Automático
Autores: Bhandary, Rakshith; Ghosh, Bidyut Kumar
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Predicción de Incumplimiento de Tarjetas de Crédito: Un Análisis Empírico sobre el Rendimiento Predictivo Utilizando Métodos Estadísticos y de Aprendizaje Automático
Categoría
Gestión y administración
Subcategoría
Gestión de recursos
Palabras clave
Análisis comparativo
Modelos
Aprendizaje automático
Métodos estadísticos
Rendimiento predictivo
Red neuronal profunda
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Este artículo compara las capacidades predictivas de seis modelos, a saber, análisis discriminante lineal (LDA), regresión logística (LR), máquina de soporte vectorial (SVM), XGBoost, bosque aleatorio (RF) y red neuronal profunda (DNN), para predecir el comportamiento de incumplimiento de los titulares de tarjetas de crédito en Taiwán utilizando datos de la base de datos de aprendizaje automático de UCI. Se utilizó el lenguaje de programación Python para el análisis de datos. Se compararon métodos estadísticos con algoritmos de aprendizaje automático utilizando la matriz de confusión medida en términos métricos de precisión de predicción, sensibilidad, especificidad, precisión, G-mean, puntuación F1, ROC y AUC. El conjunto de datos contenía información de 30,000 usuarios de tarjetas de crédito, con 6,636 observaciones de incumplimiento y 23,364 casos no incumplidos. Los resultados del estudio encontraron que los métodos modernos de aprendizaje automático superaron a los métodos estadísticos tradicionales en términos de rendimiento predictivo medido por la puntuación F1, G-mean y AUC. Los métodos tradicionales como la regresión logística fueron marginalmente mejores que el análisis discriminante lineal y las máquinas de soporte vectorial en términos de rendimiento predictivo medido por el área bajo la curva de características operativas del receptor. En los métodos modernos de aprendizaje automático, la red neuronal profunda fue mejor en las métricas de rendimiento predictivo en comparación con los métodos de XGBoost y bosque aleatorio.
Descripción
Este artículo compara las capacidades predictivas de seis modelos, a saber, análisis discriminante lineal (LDA), regresión logística (LR), máquina de soporte vectorial (SVM), XGBoost, bosque aleatorio (RF) y red neuronal profunda (DNN), para predecir el comportamiento de incumplimiento de los titulares de tarjetas de crédito en Taiwán utilizando datos de la base de datos de aprendizaje automático de UCI. Se utilizó el lenguaje de programación Python para el análisis de datos. Se compararon métodos estadísticos con algoritmos de aprendizaje automático utilizando la matriz de confusión medida en términos métricos de precisión de predicción, sensibilidad, especificidad, precisión, G-mean, puntuación F1, ROC y AUC. El conjunto de datos contenía información de 30,000 usuarios de tarjetas de crédito, con 6,636 observaciones de incumplimiento y 23,364 casos no incumplidos. Los resultados del estudio encontraron que los métodos modernos de aprendizaje automático superaron a los métodos estadísticos tradicionales en términos de rendimiento predictivo medido por la puntuación F1, G-mean y AUC. Los métodos tradicionales como la regresión logística fueron marginalmente mejores que el análisis discriminante lineal y las máquinas de soporte vectorial en términos de rendimiento predictivo medido por el área bajo la curva de características operativas del receptor. En los métodos modernos de aprendizaje automático, la red neuronal profunda fue mejor en las métricas de rendimiento predictivo en comparación con los métodos de XGBoost y bosque aleatorio.