Clasificación de textos de programas representados como cadenas de Markov con algoritmos inspirados en biología: Máquinas de aprendizaje extremo mejoradas
Autores: Demidova, Liliya A.; Gorchakov, Artyom V.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Clasificación de textos de programas representados como cadenas de Markov con algoritmos inspirados en biología: Máquinas de aprendizaje extremo mejoradas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Naturaleza masiva
Cursos de programación universitaria
Sistema de Asistente de Enseñanza Digital (DTA)
Enfoque basado en aprendizaje automático
Algoritmos de clasificación multi-clase
Máquina de aprendizaje extremo (ELM)
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
La naturaleza masiva de los cursos de programación universitaria modernos aumenta la carga sobre los trabajadores académicos. El sistema de Asistente de Enseñanza Digital (DTA) aborda este problema automatizando la generación y verificación de ejercicios de programación únicos, y proporciona medios para analizar los programas recibidos de los estudiantes al final del semestre. En este documento, proponemos un enfoque basado en aprendizaje automático para la clasificación de programas de estudiantes representados como cadenas de Markov. El enfoque propuesto permite el análisis en tiempo real de las presentaciones de los estudiantes en el sistema DTA. Comparamos el rendimiento de diferentes algoritmos de clasificación multiclase, como la máquina de soporte vectorial (SVM), el algoritmo de los k vecinos más cercanos (KNN), el bosque aleatorio (RF) y la máquina de aprendizaje extremo (ELM). ELM es un esquema de aprendizaje de red neuronal alimentada hacia adelante de una sola capa oculta que acelera drásticamente el proceso de entrenamiento de la red. Esto se logra inicializando aleatoriamente los pesos de las conexiones entre las neuronas de entrada y ocultas, y calculando explícitamente los pesos de las conexiones entre las neuronas ocultas y de salida. Los resultados experimentales muestran que ELM es el algoritmo más eficiente computacionalmente entre los considerados. Además, aplicamos algoritmos inspirados en biología para ajustar finamente los pesos de entrada de ELM con el fin de mejorar aún más las capacidades de generalización de este algoritmo. Los resultados obtenidos muestran que las ELM ajustadas con algoritmos inspirados en biología logran la mejor precisión en los datos de prueba en la mayoría de los problemas considerados.
Descripción
La naturaleza masiva de los cursos de programación universitaria modernos aumenta la carga sobre los trabajadores académicos. El sistema de Asistente de Enseñanza Digital (DTA) aborda este problema automatizando la generación y verificación de ejercicios de programación únicos, y proporciona medios para analizar los programas recibidos de los estudiantes al final del semestre. En este documento, proponemos un enfoque basado en aprendizaje automático para la clasificación de programas de estudiantes representados como cadenas de Markov. El enfoque propuesto permite el análisis en tiempo real de las presentaciones de los estudiantes en el sistema DTA. Comparamos el rendimiento de diferentes algoritmos de clasificación multiclase, como la máquina de soporte vectorial (SVM), el algoritmo de los k vecinos más cercanos (KNN), el bosque aleatorio (RF) y la máquina de aprendizaje extremo (ELM). ELM es un esquema de aprendizaje de red neuronal alimentada hacia adelante de una sola capa oculta que acelera drásticamente el proceso de entrenamiento de la red. Esto se logra inicializando aleatoriamente los pesos de las conexiones entre las neuronas de entrada y ocultas, y calculando explícitamente los pesos de las conexiones entre las neuronas ocultas y de salida. Los resultados experimentales muestran que ELM es el algoritmo más eficiente computacionalmente entre los considerados. Además, aplicamos algoritmos inspirados en biología para ajustar finamente los pesos de entrada de ELM con el fin de mejorar aún más las capacidades de generalización de este algoritmo. Los resultados obtenidos muestran que las ELM ajustadas con algoritmos inspirados en biología logran la mejor precisión en los datos de prueba en la mayoría de los problemas considerados.