Predicción de incumplimiento de préstamos basada en datos: un enfoque de aprendizaje automático para mejorar la gestión de procesos empresariales
Autores: Zhang, Xinyu; Zhang, Tianhui; Hou, Lingmin; Liu, Xianchen; Guo, Zhen; Tian, Yuanhao; Liu, Yang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Predicción de incumplimiento de préstamos basada en datos: un enfoque de aprendizaje automático para mejorar la gestión de procesos empresariales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Predicción de incumplimiento de préstamos
Modelos de aprendizaje automático
XGBoost
Gradient Boosting
Random Forest
LightGBM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La predicción de incumplimiento de préstamos es una tarea crítica para las instituciones financieras, que influye directamente en la gestión de riesgos, las decisiones de aprobación de préstamos y la rentabilidad. Este estudio evalúa la efectividad de los modelos de aprendizaje automático, específicamente XGBoost, Gradient Boosting, Random Forest y LightGBM, en la predicción de incumplimientos de préstamos. La investigación investiga la siguiente pregunta: ¿Qué tan efectivos son los modelos de aprendizaje automático para predecir incumplimientos de préstamos en comparación con los enfoques tradicionales? Se desarrolla un pipeline estructurado de aprendizaje automático, que incluye preprocesamiento de datos, ingeniería de características, manejo del desequilibrio de clases (SMOTE y ponderación de clases), entrenamiento de modelos, ajuste de hiperparámetros y evaluación. Los modelos se evalúan utilizando precisión, F1-score, ROC AUC, curvas de precisión-recall y matrices de confusión. Los resultados muestran que Gradient Boosting logra el mejor rendimiento de clasificación general (precisión = 0.8887, F1-score = 0.8084, recall = 0.8021), convirtiéndose en el modelo más efectivo para identificar a los incumplidores. XGBoost exhibe un poder discriminatorio superior con el más alto ROC AUC (0.9714). Se incorpora un procedimiento de ajuste de umbral sensible al costo para alinear las predicciones con los pesos de pérdida regulatorios y apoyar los requisitos de auditoría.
Descripción
La predicción de incumplimiento de préstamos es una tarea crítica para las instituciones financieras, que influye directamente en la gestión de riesgos, las decisiones de aprobación de préstamos y la rentabilidad. Este estudio evalúa la efectividad de los modelos de aprendizaje automático, específicamente XGBoost, Gradient Boosting, Random Forest y LightGBM, en la predicción de incumplimientos de préstamos. La investigación investiga la siguiente pregunta: ¿Qué tan efectivos son los modelos de aprendizaje automático para predecir incumplimientos de préstamos en comparación con los enfoques tradicionales? Se desarrolla un pipeline estructurado de aprendizaje automático, que incluye preprocesamiento de datos, ingeniería de características, manejo del desequilibrio de clases (SMOTE y ponderación de clases), entrenamiento de modelos, ajuste de hiperparámetros y evaluación. Los modelos se evalúan utilizando precisión, F1-score, ROC AUC, curvas de precisión-recall y matrices de confusión. Los resultados muestran que Gradient Boosting logra el mejor rendimiento de clasificación general (precisión = 0.8887, F1-score = 0.8084, recall = 0.8021), convirtiéndose en el modelo más efectivo para identificar a los incumplidores. XGBoost exhibe un poder discriminatorio superior con el más alto ROC AUC (0.9714). Se incorpora un procedimiento de ajuste de umbral sensible al costo para alinear las predicciones con los pesos de pérdida regulatorios y apoyar los requisitos de auditoría.