(SDGFI) identificación de características demográficas y geográficas de los estudiantes utilizando técnicas de aprendizaje automático para aplicaciones web automatizadas en tiempo real
Autores: Verma, Chaman; Illés, Zoltán; Kumar, Deepak
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
(SDGFI) identificación de características demográficas y geográficas de los estudiantes utilizando técnicas de aprendizaje automático para aplicaciones web automatizadas en tiempo real
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Formulario de Google
Datos de investigación
Características demográficas
Características geográficas
Aprendizaje automático
Algoritmo predictivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Hoy en día, Google Forms se está convirtiendo en una herramienta de vanguardia para recopilar datos de investigación en el ámbito educativo. Varios investigadores están utilizando aplicaciones web en tiempo real para recopilar las respuestas de los encuestados. Las características demográficas y geográficas son las más importantes en el estudio del investigador. Identificar las características demográficas de los estudiantes (género, grupo de edad, curso, institución o universidad) y las características geográficas (localidad y país) es un problema desafiante en el aprendizaje automático. Hemos propuesto un nuevo algoritmo predictivo, Identificación Demográfica del Estudiante (SDI), para identificar las características demográficas de un estudiante (grupo de edad, curso) con la mayor precisión. SDI ha sido probado en muestras primarias confiables. SDI también ha sido comparado con los algoritmos de aprendizaje automático tradicionales Random Forest (RF), Regresión Logística (LR) y Máquina de Vectores de Soporte Radial (R-SVM). El algoritmo propuesto mejoró significativamente las métricas de rendimiento como precisión, puntuación F1, precisión, recuperación y coeficiente de correlación de Matthews (MCC) de estos clasificadores. También propusimos características significativas para identificar el grupo de edad, curso y género de los estudiantes. SDI ha identificado el grupo de edad de los estudiantes con una precisión del 96% y el curso con una precisión del 97%. Gradient Boosting (GB) ha mejorado la precisión de LR, R-SVM y RF para predecir el género de los estudiantes. Además, el algoritmo RF con el soporte de GB logró la mayor precisión del 98% para identificar el género de los estudiantes. Los tres clasificadores también han identificado la localidad e institución de los estudiantes con una precisión idéntica del 99%. Nuestro algoritmo propuesto SDI puede ser útil para aplicaciones de encuestas en tiempo real para predecir las características demográficas de los estudiantes.
Descripción
Hoy en día, Google Forms se está convirtiendo en una herramienta de vanguardia para recopilar datos de investigación en el ámbito educativo. Varios investigadores están utilizando aplicaciones web en tiempo real para recopilar las respuestas de los encuestados. Las características demográficas y geográficas son las más importantes en el estudio del investigador. Identificar las características demográficas de los estudiantes (género, grupo de edad, curso, institución o universidad) y las características geográficas (localidad y país) es un problema desafiante en el aprendizaje automático. Hemos propuesto un nuevo algoritmo predictivo, Identificación Demográfica del Estudiante (SDI), para identificar las características demográficas de un estudiante (grupo de edad, curso) con la mayor precisión. SDI ha sido probado en muestras primarias confiables. SDI también ha sido comparado con los algoritmos de aprendizaje automático tradicionales Random Forest (RF), Regresión Logística (LR) y Máquina de Vectores de Soporte Radial (R-SVM). El algoritmo propuesto mejoró significativamente las métricas de rendimiento como precisión, puntuación F1, precisión, recuperación y coeficiente de correlación de Matthews (MCC) de estos clasificadores. También propusimos características significativas para identificar el grupo de edad, curso y género de los estudiantes. SDI ha identificado el grupo de edad de los estudiantes con una precisión del 96% y el curso con una precisión del 97%. Gradient Boosting (GB) ha mejorado la precisión de LR, R-SVM y RF para predecir el género de los estudiantes. Además, el algoritmo RF con el soporte de GB logró la mayor precisión del 98% para identificar el género de los estudiantes. Los tres clasificadores también han identificado la localidad e institución de los estudiantes con una precisión idéntica del 99%. Nuestro algoritmo propuesto SDI puede ser útil para aplicaciones de encuestas en tiempo real para predecir las características demográficas de los estudiantes.