logo móvil
Contáctanos

Benchmarking Variantes de Eliminación Recursiva de Características: Perspectivas de Tareas Predictivas en Educación y Atención Médica

Autores: Bulut, Okan; Tan, Bin; Mazzullo, Elisabetta; Syed, Ali

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Benchmarking Variantes de Eliminación Recursiva de Características: Perspectivas de Tareas Predictivas en Educación y Atención Médica


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Eliminación recursiva de características
Minería de datos educativos
Modelos de aprendizaje automático
Métricas de importancia de características
Estabilidad en la selección de características
Costo computacional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Desarrollado originalmente como un método efectivo de selección de características en análisis predictivo de salud, la Eliminación Recursiva de Características (RFE) ha ganado una creciente popularidad en la Minería de Datos Educativos (EDM) debido a su capacidad para manejar datos de alta dimensión y apoyar modelos interpretables. Con el tiempo, han surgido varias variantes de RFE, cada una introduciendo mejoras metodológicas. Para ayudar a los investigadores a comprender y aplicar RFE de manera más efectiva, este estudio organiza las variantes existentes en cuatro categorías metodológicas: (1) integración con diferentes modelos de aprendizaje automático, (2) combinaciones de múltiples métricas de importancia de características, (3) modificaciones al proceso original de RFE, y (4) hibridación con otras técnicas de selección de características o reducción de dimensionalidad. En lugar de realizar una revisión sistemática, presentamos una síntesis narrativa respaldada por estudios ilustrativos de EDM para demostrar cómo se han aplicado diferentes variantes en la práctica. También llevamos a cabo una evaluación empírica de cinco variantes representativas de RFE en dos dominios: una tarea de regresión utilizando un conjunto de datos educativos a gran escala y una tarea de clasificación utilizando un conjunto de datos clínicos sobre insuficiencia cardíaca crónica. Nuestra evaluación mide la precisión predictiva, la estabilidad de la selección de características y la eficiencia del tiempo de ejecución. Los resultados muestran que las métricas de evaluación varían significativamente entre las variantes de RFE. Por ejemplo, mientras que RFE envuelto con modelos basados en árboles como Random Forest y Extreme Gradient Boosting (XGBoost) produce un fuerte rendimiento predictivo, estos métodos tienden a retener grandes conjuntos de características y incurrir en altos costos computacionales. En contraste, una variante conocida como RFE Mejorada logra una reducción sustancial de características con solo una pérdida marginal de precisión, ofreciendo un equilibrio favorable entre eficiencia y rendimiento. Estos hallazgos subrayan las compensaciones entre precisión, interpretabilidad y costo computacional entre las variantes de RFE, proporcionando orientación práctica para seleccionar el algoritmo más apropiado según las necesidades y restricciones específicas del dominio.

Otros recursos que podrían interesarte

Temas Virtualpro