Enfoques de Aprendizaje Automático para la Predicción Temprana del Rendimiento Estudiantil en la Educación en Programación
Autores: Bouallegue, Seifeddine; Omri, Aymen; Al-Naemi, Salem
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Enfoques de Aprendizaje Automático para la Predicción Temprana del Rendimiento Estudiantil en la Educación en Programación
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sistemas de recomendación inteligentes
Predicción del rendimiento estudiantil
Modelos de aprendizaje automático
Calificaciones del examen final
Datos de estudiantes
Análisis de la importancia de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los sistemas de recomendación inteligentes son esenciales para identificar a los estudiantes en riesgo y personalizar el aprendizaje a través de recursos adaptados. La predicción precisa del rendimiento estudiantil permite que estos sistemas ofrezcan intervenciones oportunas y apoyo basado en datos. Este documento presenta la aplicación de modelos de aprendizaje automático para predecir las calificaciones del examen final en un curso de programación a nivel universitario, aprovechando datos estudiantiles multimodales para mejorar la precisión de la predicción. En particular, se procesó inicialmente un conjunto de datos en bruto reciente de estudiantes inscritos en un curso de programación en 36 secciones de clase durante los términos de otoño de 2024 e invierno de 2025. Los datos se recopilaron hasta un mes antes del examen final. A partir de estos datos, se ingenió un conjunto completo de características, incluyendo el trasfondo del estudiante, las calificaciones de las evaluaciones y los tiempos de finalización, las interacciones de aprendizaje digital y las métricas de compromiso. Basándose en este conjunto de características, se desarrollaron inicialmente seis modelos de predicción de aprendizaje automático utilizando datos del término de otoño de 2024. Tanto el entrenamiento como la prueba se llevaron a cabo en este conjunto de datos utilizando validación cruzada combinada con ajuste de hiperparámetros. El modelo XGBoost demostró un rendimiento sólido, alcanzando una precisión superior al 91%. Para evaluar la generalizabilidad de los modelos considerados, todos los modelos fueron reentrenados en el conjunto de datos completo de otoño de 2024. Luego se evaluaron en un conjunto de datos independiente del invierno de 2025, con XGBoost logrando la mayor precisión, superando el 84%. El análisis de la importancia de las características ha revelado que la calificación del examen parcial y la duración promedio de finalización de las evaluaciones de laboratorio son los predictores más influyentes. Este enfoque basado en datos empodera a los instructores para identificar y apoyar proactivamente a los estudiantes en riesgo, permitiendo entornos de aprendizaje adaptativos que ofrecen aprendizaje personalizado e intervenciones oportunas.
Descripción
Los sistemas de recomendación inteligentes son esenciales para identificar a los estudiantes en riesgo y personalizar el aprendizaje a través de recursos adaptados. La predicción precisa del rendimiento estudiantil permite que estos sistemas ofrezcan intervenciones oportunas y apoyo basado en datos. Este documento presenta la aplicación de modelos de aprendizaje automático para predecir las calificaciones del examen final en un curso de programación a nivel universitario, aprovechando datos estudiantiles multimodales para mejorar la precisión de la predicción. En particular, se procesó inicialmente un conjunto de datos en bruto reciente de estudiantes inscritos en un curso de programación en 36 secciones de clase durante los términos de otoño de 2024 e invierno de 2025. Los datos se recopilaron hasta un mes antes del examen final. A partir de estos datos, se ingenió un conjunto completo de características, incluyendo el trasfondo del estudiante, las calificaciones de las evaluaciones y los tiempos de finalización, las interacciones de aprendizaje digital y las métricas de compromiso. Basándose en este conjunto de características, se desarrollaron inicialmente seis modelos de predicción de aprendizaje automático utilizando datos del término de otoño de 2024. Tanto el entrenamiento como la prueba se llevaron a cabo en este conjunto de datos utilizando validación cruzada combinada con ajuste de hiperparámetros. El modelo XGBoost demostró un rendimiento sólido, alcanzando una precisión superior al 91%. Para evaluar la generalizabilidad de los modelos considerados, todos los modelos fueron reentrenados en el conjunto de datos completo de otoño de 2024. Luego se evaluaron en un conjunto de datos independiente del invierno de 2025, con XGBoost logrando la mayor precisión, superando el 84%. El análisis de la importancia de las características ha revelado que la calificación del examen parcial y la duración promedio de finalización de las evaluaciones de laboratorio son los predictores más influyentes. Este enfoque basado en datos empodera a los instructores para identificar y apoyar proactivamente a los estudiantes en riesgo, permitiendo entornos de aprendizaje adaptativos que ofrecen aprendizaje personalizado e intervenciones oportunas.