Decisión de crédito basada en un conjunto real de préstamos en efectivo utilizando algoritmos integrados de aprendizaje automático
Autores: Ziemba, Pawe; Becker, Jarosaw; Becker, Aneta; Radomska-Zalas, Aleksandra; Pawluk, Mateusz; Wierzba, Dariusz
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Decisión de crédito basada en un conjunto real de préstamos en efectivo utilizando algoritmos integrados de aprendizaje automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Problemas de investigación
Instituciones financieras
Riesgo crediticio
Aprendizaje automático
Selección de características
Clasificación binaria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Uno de los problemas de investigación importantes en el contexto de las instituciones financieras es la evaluación del riesgo crediticio y la decisión de otorgar o rechazar un préstamo. Recientemente, los métodos basados en aprendizaje automático se emplean cada vez más para resolver tales problemas. Sin embargo, la selección de la técnica de selección de características apropiada, el mecanismo de muestreo y/o los clasificadores para el soporte de decisión de crédito son muy desafiantes y pueden afectar la calidad de las recomendaciones de préstamos. Para abordar esta tarea desafiante, este artículo examina la efectividad de varias técnicas de ciencia de datos en el tema del soporte de decisión de crédito. En particular, se diseñó un pipeline de procesamiento que consta de métodos para el remuestreo de datos, discretización de características, selección de características y clasificación binaria. Sugerimos construir modelos de decisión apropiados aprovechando métodos pertinentes para la clasificación binaria, selección de características, así como remuestreo de datos y discretización de características. El análisis de viabilidad de los modelos seleccionados se realizó a través de experimentos rigurosos en datos reales que describen la capacidad del cliente para el pago del préstamo. Durante los experimentos, analizamos el impacto de la selección de características en los resultados de la clasificación binaria y el impacto del remuestreo de datos con discretización de características en los resultados de la selección de características y la clasificación binaria. Después de la evaluación experimental, encontramos que la técnica de selección de características basada en correlación y el clasificador de bosque aleatorio ofrecen un rendimiento superior en la resolución del problema subyacente.
Descripción
Uno de los problemas de investigación importantes en el contexto de las instituciones financieras es la evaluación del riesgo crediticio y la decisión de otorgar o rechazar un préstamo. Recientemente, los métodos basados en aprendizaje automático se emplean cada vez más para resolver tales problemas. Sin embargo, la selección de la técnica de selección de características apropiada, el mecanismo de muestreo y/o los clasificadores para el soporte de decisión de crédito son muy desafiantes y pueden afectar la calidad de las recomendaciones de préstamos. Para abordar esta tarea desafiante, este artículo examina la efectividad de varias técnicas de ciencia de datos en el tema del soporte de decisión de crédito. En particular, se diseñó un pipeline de procesamiento que consta de métodos para el remuestreo de datos, discretización de características, selección de características y clasificación binaria. Sugerimos construir modelos de decisión apropiados aprovechando métodos pertinentes para la clasificación binaria, selección de características, así como remuestreo de datos y discretización de características. El análisis de viabilidad de los modelos seleccionados se realizó a través de experimentos rigurosos en datos reales que describen la capacidad del cliente para el pago del préstamo. Durante los experimentos, analizamos el impacto de la selección de características en los resultados de la clasificación binaria y el impacto del remuestreo de datos con discretización de características en los resultados de la selección de características y la clasificación binaria. Después de la evaluación experimental, encontramos que la técnica de selección de características basada en correlación y el clasificador de bosque aleatorio ofrecen un rendimiento superior en la resolución del problema subyacente.