logo móvil
Contáctanos

Evaluando la validez de la validación cruzada k-fold para la selección de modelos: evidencia de predicción de quiebra utilizando Random Forest y XGBoost

Autores: Teodorescu, Vlad; Obreja Braoveanu, Laura

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Evaluando la validez de la validación cruzada k-fold para la selección de modelos: evidencia de predicción de quiebra utilizando Random Forest y XGBoost


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Prediciendo la quiebra corporativa
Gestión del riesgo financiero
Modelo de aprendizaje automático
Validación cruzada
Clasificador XGBoost

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 20

Citaciones: Sin citaciones


Descripción
Predecir la quiebra corporativa es una tarea clave en la gestión de riesgos financieros, y seleccionar un modelo de aprendizaje automático con un rendimiento de generalización superior es crucial para la precisión de la predicción. Este estudio evalúa la efectividad de la validación cruzada k-fold como estrategia de selección de modelo para clasificadores de bosques aleatorios y XGBoost utilizando un conjunto de datos de empresas taiwanesas listadas públicamente. Empleamos un marco de validación cruzada anidado para evaluar la relación entre la validación cruzada (CV) y el rendimiento fuera de muestra (OOS) en 40 particiones de datos de entrenamiento/prueba diferentes. En promedio, encontramos que la validación cruzada k-fold es una técnica de selección válida cuando se aplica dentro de una clase de modelo; sin embargo, la validación cruzada k-fold puede fallar para divisiones de datos de entrenamiento/prueba específicas. Descubrimos que el 67% de la variabilidad en el arrepentimiento de la selección de modelo se explica por la división específica de datos de entrenamiento/prueba, resaltando una incertidumbre irredimible con la que los profesionales del mundo real deben lidiar. Nuestro estudio explora extensamente la sintonización de hiperparámetros para ambos clasificadores y destaca ideas clave. Además, investigamos elecciones de implementación práctica en la validación cruzada k-fold, como el valor de k o estrategias de predicción. Concluimos que la validación cruzada k-fold es efectiva para la selección de modelos dentro de una clase de modelo y en promedio, pero puede ser poco confiable en casos específicos o al comparar modelos de diferentes clases, este último problema merece una mayor investigación.

Otros recursos que podrían interesarte

Temas Virtualpro