Selección de características en un modelo de puntuación crediticia
Autores: Laborda, Juan; Ryoo, Seyong
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Selección de características en un modelo de puntuación crediticia
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Algoritmos de clasificación
Métodos de selección de características
Regresión logística
Máquina de vectores de soporte
Vecinos más cercanos de K
Bosque aleatorio
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Este documento propone diferentes algoritmos de clasificación-regresión logística, máquina de vectores de soporte, vecinos más cercanos y bosque aleatorio- para identificar qué candidatos es probable que incumplan en un modelo de puntuación crediticia. Se utilizan tres métodos de selección de características diferentes para mitigar el sobreajuste en la maldición de la dimensionalidad de estos algoritmos de clasificación: un método de filtro (prueba de Chi-cuadrado y coeficientes de correlación) y dos métodos de envoltura (selección hacia adelante paso a paso y selección hacia atrás paso a paso). Se discuten las actuaciones de estos tres métodos utilizando dos medidas, el error absoluto medio y el número de características seleccionadas. La metodología se aplica a una base de datos valiosa de Taiwán. Los resultados sugieren que la selección hacia adelante paso a paso ofrece un rendimiento superior en cada uno de los algoritmos de clasificación utilizados. Las conclusiones obtenidas están relacionadas con las de la literatura, y se analizan sus implicaciones gerenciales.
Descripción
Este documento propone diferentes algoritmos de clasificación-regresión logística, máquina de vectores de soporte, vecinos más cercanos y bosque aleatorio- para identificar qué candidatos es probable que incumplan en un modelo de puntuación crediticia. Se utilizan tres métodos de selección de características diferentes para mitigar el sobreajuste en la maldición de la dimensionalidad de estos algoritmos de clasificación: un método de filtro (prueba de Chi-cuadrado y coeficientes de correlación) y dos métodos de envoltura (selección hacia adelante paso a paso y selección hacia atrás paso a paso). Se discuten las actuaciones de estos tres métodos utilizando dos medidas, el error absoluto medio y el número de características seleccionadas. La metodología se aplica a una base de datos valiosa de Taiwán. Los resultados sugieren que la selección hacia adelante paso a paso ofrece un rendimiento superior en cada uno de los algoritmos de clasificación utilizados. Las conclusiones obtenidas están relacionadas con las de la literatura, y se analizan sus implicaciones gerenciales.