Ejercicio de Embedding Semántico para el Seguimiento del Conocimiento en Dominio Abierto
Autores: Cheng, Zhi; Li, Jinlong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Ejercicio de Embedding Semántico para el Seguimiento del Conocimiento en Dominio Abierto
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Trazado de conocimiento
Datos de dominio abierto
ESKT
Modelo de lenguaje
KTAM
Aumento de AUC
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Como una de las técnicas fundamentales de los sistemas de educación inteligente basados en datos, el rastreo del conocimiento (KT) sigue la maestría de los estudiantes en puntos de conocimiento específicos al analizar datos históricos de interacción entre estudiantes y ejercicios. Dado que la mayoría de los datos de interacción entre estudiantes y ejercicios son datos de dominio abierto en aplicaciones del mundo real, nunca se modelan nuevos ejercicios y conocimientos, lo que provoca una degradación en el rendimiento del rastreo del conocimiento. Basado en esta situación, el objetivo principal de este estudio es abordar el problema del rastreo del conocimiento en datos de dominio abierto. Para abordar esto, este documento propone un marco de rastreo del conocimiento en dos etapas, denominado Embedding Semántico de Ejercicios para el Rastreo del Conocimiento (ESKT). En la primera etapa de ESKT, la información semántica del ejercicio se incrusta en un modelo de lenguaje preentrenado (PLM). En la segunda etapa, para capturar la información semántica de las respuestas, este documento propone un Rastreo del Conocimiento con un Codificador de Respuestas y un Mecanismo de Atención a Múltiples Preguntas (KTAM). Para verificar el rendimiento del marco, se compara con la metodología de última generación (SOTA) AKT, SAINT, en el conjunto de datos de comprensión de lectura en inglés, y los resultados demuestran que ESKT puede lograr, como máximo, un aumento del 7% en el AUC en conjuntos de datos de dominio abierto. En conclusión, este documento utiliza de manera innovadora un modelo de lenguaje preentrenado para la incrustación semántica de ejercicios para resolver el problema de las tareas de rastreo del conocimiento en datos de dominio abierto.
Descripción
Como una de las técnicas fundamentales de los sistemas de educación inteligente basados en datos, el rastreo del conocimiento (KT) sigue la maestría de los estudiantes en puntos de conocimiento específicos al analizar datos históricos de interacción entre estudiantes y ejercicios. Dado que la mayoría de los datos de interacción entre estudiantes y ejercicios son datos de dominio abierto en aplicaciones del mundo real, nunca se modelan nuevos ejercicios y conocimientos, lo que provoca una degradación en el rendimiento del rastreo del conocimiento. Basado en esta situación, el objetivo principal de este estudio es abordar el problema del rastreo del conocimiento en datos de dominio abierto. Para abordar esto, este documento propone un marco de rastreo del conocimiento en dos etapas, denominado Embedding Semántico de Ejercicios para el Rastreo del Conocimiento (ESKT). En la primera etapa de ESKT, la información semántica del ejercicio se incrusta en un modelo de lenguaje preentrenado (PLM). En la segunda etapa, para capturar la información semántica de las respuestas, este documento propone un Rastreo del Conocimiento con un Codificador de Respuestas y un Mecanismo de Atención a Múltiples Preguntas (KTAM). Para verificar el rendimiento del marco, se compara con la metodología de última generación (SOTA) AKT, SAINT, en el conjunto de datos de comprensión de lectura en inglés, y los resultados demuestran que ESKT puede lograr, como máximo, un aumento del 7% en el AUC en conjuntos de datos de dominio abierto. En conclusión, este documento utiliza de manera innovadora un modelo de lenguaje preentrenado para la incrustación semántica de ejercicios para resolver el problema de las tareas de rastreo del conocimiento en datos de dominio abierto.