Evaluación de modelos de aprendizaje sensibles al costo en la predicción del fracaso empresarial de empresas del mercado de capitales
Autores: Peykani, Pejman; Peymany Foroushany, Moslem; Tanasescu, Cristina; Sargolzaei, Mostafa; Kamyabfar, Hamidreza
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Evaluación de modelos de aprendizaje sensibles al costo en la predicción del fracaso empresarial de empresas del mercado de capitales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Desafío
Datos desequilibrados
CorrOV-CSEn
Modelos
Sensibilidad
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Clasificar datos desequilibrados es un desafío bien conocido en el aprendizaje automático. Uno de los campos afectados inherentemente por datos desequilibrados es el de los conjuntos de datos de crédito en finanzas. En este estudio, para abordar este desafío, empleamos uno de los métodos más recientes desarrollados para clasificar datos desequilibrados, CorrOV-CSEn. Además del enfoque original de CorrOV-CSEn, que utiliza AdaBoost como su método de aprendizaje base, también aplicamos Perceptrón Multicapa (MLP), bosque aleatorio, árboles potenciados por gradiente, XGBoost y CatBoost. Nuestro conjunto de datos, obtenido del mercado de capitales de Irán de 2015 a 2022, utiliza el término más general y preciso de "fracaso empresarial" en lugar de incumplimiento. El rendimiento del modelo se evaluó utilizando sensibilidad, precisión y puntuación F1, mientras que su rendimiento general se comparó utilizando la prueba de Friedman-Nemenyi. Los resultados indican la alta efectividad de todos los modelos en identificar empresas en dificultades (sensibilidad), con CatBoost logrando una sensibilidad de 0.909 en los datos de prueba. Sin embargo, todos los modelos mostraron una precisión relativamente baja.
Descripción
Clasificar datos desequilibrados es un desafío bien conocido en el aprendizaje automático. Uno de los campos afectados inherentemente por datos desequilibrados es el de los conjuntos de datos de crédito en finanzas. En este estudio, para abordar este desafío, empleamos uno de los métodos más recientes desarrollados para clasificar datos desequilibrados, CorrOV-CSEn. Además del enfoque original de CorrOV-CSEn, que utiliza AdaBoost como su método de aprendizaje base, también aplicamos Perceptrón Multicapa (MLP), bosque aleatorio, árboles potenciados por gradiente, XGBoost y CatBoost. Nuestro conjunto de datos, obtenido del mercado de capitales de Irán de 2015 a 2022, utiliza el término más general y preciso de "fracaso empresarial" en lugar de incumplimiento. El rendimiento del modelo se evaluó utilizando sensibilidad, precisión y puntuación F1, mientras que su rendimiento general se comparó utilizando la prueba de Friedman-Nemenyi. Los resultados indican la alta efectividad de todos los modelos en identificar empresas en dificultades (sensibilidad), con CatBoost logrando una sensibilidad de 0.909 en los datos de prueba. Sin embargo, todos los modelos mostraron una precisión relativamente baja.