Un marco de modelado global de puntuación crediticia utilizando detección de valores atípicos y aprendizaje automático en una plataforma de préstamos P2P
Autores: Shih, Dong-Her; Wu, Ting-Wei; Shih, Po-Yuan; Lu, Nai-An; Shih, Ming-Hung
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un marco de modelado global de puntuación crediticia utilizando detección de valores atípicos y aprendizaje automático en una plataforma de préstamos P2P
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos de puntuación crediticia
Inferencia de rechazo
Préstamos P2P en línea
Métodos de selección de características
Detección de valores atípicos
Muestras de aceptación de préstamos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Un gran desafío para los modelos de puntuación crediticia en plataformas de préstamos entre particulares en línea es que los modelos de puntuación crediticia simplemente descartan a los solicitantes rechazados. Este descarte selectivo puede llevar a una incapacidad para aumentar el número de solicitantes potencialmente calificados, afectando en última instancia los ingresos de la plataforma de préstamos. Una forma de abordar esto es emplear la inferencia de rechazo, una técnica que infiere el estado de una muestra rechazada e incorpora los resultados en un modelo de puntuación crediticia. El enfoque más popular para la inferencia de rechazo es utilizar un modelo de puntuación crediticia construido solo con muestras aceptadas para predecir directamente el estado de las muestras rechazadas. Sin embargo, la distribución de las muestras aceptadas en los préstamos P2P en línea es diferente de la distribución de las muestras rechazadas, y es posible que el modelo de puntuación crediticia en la muestra original aceptada ya no sea aplicable. Además, la muestra de aceptación también puede incluir solicitantes que no pueden devolver el préstamo. Si estos solicitantes pueden ser filtrados, las pérdidas para la plataforma de préstamos también pueden reducirse. Por lo tanto, proponemos un marco de modelo de puntuación crediticia global que combina múltiples métodos de selección de características y clasificadores para evaluar mejor el modelo después de agregar muestras rechazadas. Además, este estudio utiliza métodos de detección de valores atípicos para explorar las relaciones internas de todas las muestras, lo que puede eliminar solicitantes atípicos en las muestras aceptadas o aumentar solicitantes atípicos en las muestras rechazadas. Finalmente, este estudio utiliza cuatro muestras de datos e inferencia de rechazo para construir cuatro modelos de puntuación crediticia diferentes. Los resultados experimentales muestran que el modelo de puntuación crediticia que combina Pearson y random forest propuesto en este estudio tiene una precisión y un AUC significativamente mejores que otros académicos. En comparación con estudios anteriores, utilizar la detección de valores atípicos para eliminar valores atípicos en las muestras de aceptación de préstamos e identificar posibles solicitantes de préstamos dignos de crédito en las muestras de rechazo de préstamos es una buena estrategia. Además, este estudio no solo mejora la precisión del modelo de puntuación crediticia, sino que también aumenta el número de prestamistas, lo que a su vez aumenta la rentabilidad de la plataforma de préstamos.
Descripción
Un gran desafío para los modelos de puntuación crediticia en plataformas de préstamos entre particulares en línea es que los modelos de puntuación crediticia simplemente descartan a los solicitantes rechazados. Este descarte selectivo puede llevar a una incapacidad para aumentar el número de solicitantes potencialmente calificados, afectando en última instancia los ingresos de la plataforma de préstamos. Una forma de abordar esto es emplear la inferencia de rechazo, una técnica que infiere el estado de una muestra rechazada e incorpora los resultados en un modelo de puntuación crediticia. El enfoque más popular para la inferencia de rechazo es utilizar un modelo de puntuación crediticia construido solo con muestras aceptadas para predecir directamente el estado de las muestras rechazadas. Sin embargo, la distribución de las muestras aceptadas en los préstamos P2P en línea es diferente de la distribución de las muestras rechazadas, y es posible que el modelo de puntuación crediticia en la muestra original aceptada ya no sea aplicable. Además, la muestra de aceptación también puede incluir solicitantes que no pueden devolver el préstamo. Si estos solicitantes pueden ser filtrados, las pérdidas para la plataforma de préstamos también pueden reducirse. Por lo tanto, proponemos un marco de modelo de puntuación crediticia global que combina múltiples métodos de selección de características y clasificadores para evaluar mejor el modelo después de agregar muestras rechazadas. Además, este estudio utiliza métodos de detección de valores atípicos para explorar las relaciones internas de todas las muestras, lo que puede eliminar solicitantes atípicos en las muestras aceptadas o aumentar solicitantes atípicos en las muestras rechazadas. Finalmente, este estudio utiliza cuatro muestras de datos e inferencia de rechazo para construir cuatro modelos de puntuación crediticia diferentes. Los resultados experimentales muestran que el modelo de puntuación crediticia que combina Pearson y random forest propuesto en este estudio tiene una precisión y un AUC significativamente mejores que otros académicos. En comparación con estudios anteriores, utilizar la detección de valores atípicos para eliminar valores atípicos en las muestras de aceptación de préstamos e identificar posibles solicitantes de préstamos dignos de crédito en las muestras de rechazo de préstamos es una buena estrategia. Además, este estudio no solo mejora la precisión del modelo de puntuación crediticia, sino que también aumenta el número de prestamistas, lo que a su vez aumenta la rentabilidad de la plataforma de préstamos.