Comparación de Precisión entre Cinco Algoritmos de Aprendizaje Automático para la Evaluación del Riesgo Financiero
Autores: Dong, Haokun; Liu, Rui; Tham, Allan W.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Comparación de Precisión entre Cinco Algoritmos de Aprendizaje Automático para la Evaluación del Riesgo Financiero
Categoría
Gestión y administración
Subcategoría
Gestión de recursos
Palabras clave
Predicción
Incumplimiento de préstamos
Clasificadores de aprendizaje automático
Medidas de rendimiento
Técnicas de preprocesamiento de datos
Bosque aleatorio
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
Una predicción precisa del incumplimiento de préstamos es crucial en la evaluación del riesgo crediticio. Una ligera desviación de la verdadera precisión puede causar a menudo pérdidas financieras a las instituciones de crédito. Este estudio describe el enfoque no paramétrico que compara cinco clasificadores de aprendizaje automático diferentes, combinados con un enfoque en conjuntos de datos suficientemente grandes. Presenta los hallazgos sobre varias medidas de rendimiento estándar, como precisión, exactitud, recuperación y puntuaciones F1, además del Área Bajo la Curva de la Curva Operativa del Receptor (ROC-AUC). En este estudio, se discutirán e implementarán varias técnicas de preprocesamiento de datos, incluyendo normalización y estandarización, imputación de valores faltantes y el manejo de datos desbalanceados utilizando SMOTE. Además, el estudio examina el uso de hiperparámetros en varios clasificadores. Durante la fase de construcción del modelo, varias canalizaciones alimentan datos a los cinco clasificadores de aprendizaje automático, y los resultados de rendimiento obtenidos de los cinco clasificadores se basan en muestreo con SMOTE o hiperparámetros frente a sin SMOTE y sin hiperparámetros. Cada clasificador se compara con otro en términos de precisión durante la fase de entrenamiento y predicción basada en datos fuera de muestra. Los 2 conjuntos de datos utilizados para este experimento contienen 1000 y 30,000 observaciones, respectivamente, de las cuales la proporción de entrenamiento/prueba es 80:20. Los resultados comparativos muestran que el bosque aleatorio supera a los otros cuatro clasificadores tanto en entrenamiento como en predicción real.
Descripción
Una predicción precisa del incumplimiento de préstamos es crucial en la evaluación del riesgo crediticio. Una ligera desviación de la verdadera precisión puede causar a menudo pérdidas financieras a las instituciones de crédito. Este estudio describe el enfoque no paramétrico que compara cinco clasificadores de aprendizaje automático diferentes, combinados con un enfoque en conjuntos de datos suficientemente grandes. Presenta los hallazgos sobre varias medidas de rendimiento estándar, como precisión, exactitud, recuperación y puntuaciones F1, además del Área Bajo la Curva de la Curva Operativa del Receptor (ROC-AUC). En este estudio, se discutirán e implementarán varias técnicas de preprocesamiento de datos, incluyendo normalización y estandarización, imputación de valores faltantes y el manejo de datos desbalanceados utilizando SMOTE. Además, el estudio examina el uso de hiperparámetros en varios clasificadores. Durante la fase de construcción del modelo, varias canalizaciones alimentan datos a los cinco clasificadores de aprendizaje automático, y los resultados de rendimiento obtenidos de los cinco clasificadores se basan en muestreo con SMOTE o hiperparámetros frente a sin SMOTE y sin hiperparámetros. Cada clasificador se compara con otro en términos de precisión durante la fase de entrenamiento y predicción basada en datos fuera de muestra. Los 2 conjuntos de datos utilizados para este experimento contienen 1000 y 30,000 observaciones, respectivamente, de las cuales la proporción de entrenamiento/prueba es 80:20. Los resultados comparativos muestran que el bosque aleatorio supera a los otros cuatro clasificadores tanto en entrenamiento como en predicción real.