logo móvil
Contáctanos

Comparación de Precisión entre Cinco Algoritmos de Aprendizaje Automático para la Evaluación del Riesgo Financiero

Autores: Dong, Haokun; Liu, Rui; Tham, Allan W.

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Comparación de Precisión entre Cinco Algoritmos de Aprendizaje Automático para la Evaluación del Riesgo Financiero


Categoría

Gestión y administración

Subcategoría

Gestión de recursos

Palabras clave

Predicción
Incumplimiento de préstamos
Clasificadores de aprendizaje automático
Medidas de rendimiento
Técnicas de preprocesamiento de datos
Bosque aleatorio

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 17

Citaciones: Sin citaciones


Descripción
Una predicción precisa del incumplimiento de préstamos es crucial en la evaluación del riesgo crediticio. Una ligera desviación de la verdadera precisión puede causar a menudo pérdidas financieras a las instituciones de crédito. Este estudio describe el enfoque no paramétrico que compara cinco clasificadores de aprendizaje automático diferentes, combinados con un enfoque en conjuntos de datos suficientemente grandes. Presenta los hallazgos sobre varias medidas de rendimiento estándar, como precisión, exactitud, recuperación y puntuaciones F1, además del Área Bajo la Curva de la Curva Operativa del Receptor (ROC-AUC). En este estudio, se discutirán e implementarán varias técnicas de preprocesamiento de datos, incluyendo normalización y estandarización, imputación de valores faltantes y el manejo de datos desbalanceados utilizando SMOTE. Además, el estudio examina el uso de hiperparámetros en varios clasificadores. Durante la fase de construcción del modelo, varias canalizaciones alimentan datos a los cinco clasificadores de aprendizaje automático, y los resultados de rendimiento obtenidos de los cinco clasificadores se basan en muestreo con SMOTE o hiperparámetros frente a sin SMOTE y sin hiperparámetros. Cada clasificador se compara con otro en términos de precisión durante la fase de entrenamiento y predicción basada en datos fuera de muestra. Los 2 conjuntos de datos utilizados para este experimento contienen 1000 y 30,000 observaciones, respectivamente, de las cuales la proporción de entrenamiento/prueba es 80:20. Los resultados comparativos muestran que el bosque aleatorio supera a los otros cuatro clasificadores tanto en entrenamiento como en predicción real.

Otros recursos que podrían interesarte

Temas Virtualpro