Un estudio comparativo de rendimiento de aprendizaje en conjunto para puntuación crediticia
Autores: Li, Yiheng; Chen, Weidong
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Un estudio comparativo de rendimiento de aprendizaje en conjunto para puntuación crediticia
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Investigación extensa
Modelos de puntuación de crédito
Aprendizaje de conjunto
Bosque aleatorio
XGBoost
Regresión logística
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Se ha realizado una extensa investigación por parte de organizaciones y académicos sobre modelos para la calificación crediticia, una actividad importante de gestión financiera. Con la continua propuesta de nuevos modelos de aprendizaje automático, se ha introducido el aprendizaje en conjunto en la aplicación de la calificación crediticia, varios estudios han abordado la supremacía del aprendizaje en conjunto. En esta investigación, proporcionamos una evaluación comparativa del rendimiento de algoritmos en conjunto, es decir, bosque aleatorio, AdaBoost, XGBoost, LightGBM y Stacking, en términos de precisión (ACC), área bajo la curva (AUC), estadística de Kolmogorov-Smirnov (KS), puntuación Brier (BS) y tiempo de funcionamiento del modelo en términos de calificación crediticia. Además, se consideran cinco clasificadores de referencia populares, es decir, red neuronal (NN), árbol de decisiones (DT), regresión logística (LR), Naïve Bayes (NB) y máquina de vectores de soporte (SVM). Los hallazgos experimentales revelan que el rendimiento del aprendizaje en conjunto es mejor que el de los aprendices individuales, excepto para AdaBoost. Además, el bosque aleatorio tiene el mejor rendimiento en términos de cinco métricas, XGBoost y LightGBM son competidores cercanos. Entre los cinco clasificadores de referencia, la regresión logística supera a los otros clasificadores en la mayoría de las métricas de evaluación. Finalmente, este estudio también analiza las razones de un bajo rendimiento de algunos algoritmos y ofrece algunas sugerencias sobre la elección de modelos de calificación crediticia para instituciones financieras.
Descripción
Se ha realizado una extensa investigación por parte de organizaciones y académicos sobre modelos para la calificación crediticia, una actividad importante de gestión financiera. Con la continua propuesta de nuevos modelos de aprendizaje automático, se ha introducido el aprendizaje en conjunto en la aplicación de la calificación crediticia, varios estudios han abordado la supremacía del aprendizaje en conjunto. En esta investigación, proporcionamos una evaluación comparativa del rendimiento de algoritmos en conjunto, es decir, bosque aleatorio, AdaBoost, XGBoost, LightGBM y Stacking, en términos de precisión (ACC), área bajo la curva (AUC), estadística de Kolmogorov-Smirnov (KS), puntuación Brier (BS) y tiempo de funcionamiento del modelo en términos de calificación crediticia. Además, se consideran cinco clasificadores de referencia populares, es decir, red neuronal (NN), árbol de decisiones (DT), regresión logística (LR), Naïve Bayes (NB) y máquina de vectores de soporte (SVM). Los hallazgos experimentales revelan que el rendimiento del aprendizaje en conjunto es mejor que el de los aprendices individuales, excepto para AdaBoost. Además, el bosque aleatorio tiene el mejor rendimiento en términos de cinco métricas, XGBoost y LightGBM son competidores cercanos. Entre los cinco clasificadores de referencia, la regresión logística supera a los otros clasificadores en la mayoría de las métricas de evaluación. Finalmente, este estudio también analiza las razones de un bajo rendimiento de algunos algoritmos y ofrece algunas sugerencias sobre la elección de modelos de calificación crediticia para instituciones financieras.