Evaluando la validez de la validación cruzada k-fold para la selección de modelos: evidencia de predicción de quiebra utilizando Random Forest y XGBoost
Autores: Teodorescu, Vlad; Obreja Braoveanu, Laura
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Evaluando la validez de la validación cruzada k-fold para la selección de modelos: evidencia de predicción de quiebra utilizando Random Forest y XGBoost
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Prediciendo la quiebra corporativa
Gestión del riesgo financiero
Modelo de aprendizaje automático
Validación cruzada
Clasificador XGBoost
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Predecir la quiebra corporativa es una tarea clave en la gestión de riesgos financieros, y seleccionar un modelo de aprendizaje automático con un rendimiento de generalización superior es crucial para la precisión de la predicción. Este estudio evalúa la efectividad de la validación cruzada k-fold como estrategia de selección de modelo para clasificadores de bosques aleatorios y XGBoost utilizando un conjunto de datos de empresas taiwanesas listadas públicamente. Empleamos un marco de validación cruzada anidado para evaluar la relación entre la validación cruzada (CV) y el rendimiento fuera de muestra (OOS) en 40 particiones de datos de entrenamiento/prueba diferentes. En promedio, encontramos que la validación cruzada k-fold es una técnica de selección válida cuando se aplica dentro de una clase de modelo; sin embargo, la validación cruzada k-fold puede fallar para divisiones de datos de entrenamiento/prueba específicas. Descubrimos que el 67% de la variabilidad en el arrepentimiento de la selección de modelo se explica por la división específica de datos de entrenamiento/prueba, resaltando una incertidumbre irredimible con la que los profesionales del mundo real deben lidiar. Nuestro estudio explora extensamente la sintonización de hiperparámetros para ambos clasificadores y destaca ideas clave. Además, investigamos elecciones de implementación práctica en la validación cruzada k-fold, como el valor de k o estrategias de predicción. Concluimos que la validación cruzada k-fold es efectiva para la selección de modelos dentro de una clase de modelo y en promedio, pero puede ser poco confiable en casos específicos o al comparar modelos de diferentes clases, este último problema merece una mayor investigación.
Descripción
Predecir la quiebra corporativa es una tarea clave en la gestión de riesgos financieros, y seleccionar un modelo de aprendizaje automático con un rendimiento de generalización superior es crucial para la precisión de la predicción. Este estudio evalúa la efectividad de la validación cruzada k-fold como estrategia de selección de modelo para clasificadores de bosques aleatorios y XGBoost utilizando un conjunto de datos de empresas taiwanesas listadas públicamente. Empleamos un marco de validación cruzada anidado para evaluar la relación entre la validación cruzada (CV) y el rendimiento fuera de muestra (OOS) en 40 particiones de datos de entrenamiento/prueba diferentes. En promedio, encontramos que la validación cruzada k-fold es una técnica de selección válida cuando se aplica dentro de una clase de modelo; sin embargo, la validación cruzada k-fold puede fallar para divisiones de datos de entrenamiento/prueba específicas. Descubrimos que el 67% de la variabilidad en el arrepentimiento de la selección de modelo se explica por la división específica de datos de entrenamiento/prueba, resaltando una incertidumbre irredimible con la que los profesionales del mundo real deben lidiar. Nuestro estudio explora extensamente la sintonización de hiperparámetros para ambos clasificadores y destaca ideas clave. Además, investigamos elecciones de implementación práctica en la validación cruzada k-fold, como el valor de k o estrategias de predicción. Concluimos que la validación cruzada k-fold es efectiva para la selección de modelos dentro de una clase de modelo y en promedio, pero puede ser poco confiable en casos específicos o al comparar modelos de diferentes clases, este último problema merece una mayor investigación.