KWM-B: métodos de ponderación de información clave a múltiples escalas para la calificación automatizada de ensayos con BERT
Autores: Miao, Tengteng; Xu, Dong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
KWM-B: métodos de ponderación de información clave a múltiples escalas para la calificación automatizada de ensayos con BERT
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Puntuación automática de ensayos
Modelos preentrenados
BERT
Método de ponderación de información clave
Técnicas de aumento de datos
Kappa ponderada cuadrática
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
La tarea de Puntuación Automática de Ensayos (AES) tiene como objetivo evaluar automáticamente la calidad de los trabajos a través de máquinas, reduciendo así la carga sobre los profesores y mejorando la equidad de la calificación. Aunque los modelos preentrenados se desempeñan bien en tareas de procesamiento de lenguaje natural (NLP), en el campo de AES, grandes modelos de lenguaje preentrenados como BERT no han mostrado mayores ventajas que otros modelos de aprendizaje profundo como CNN. La investigación existente a menudo ha analizado los artículos en su totalidad, ignorando las diferencias en la importancia de la información en cada parte del artículo. En respuesta a este problema, este artículo propone un nuevo marco basado en BERT, que adopta un método de ponderación de información clave a múltiples escalas, centrándose en la información importante en las escalas de token, oración, párrafo y documento para expresar de manera más efectiva el contenido semántico de las ideas principales. Además, este artículo mejora la capacidad del modelo para identificar información clave a través de técnicas de aumento de datos. Los resultados de evaluación utilizando kappa ponderada cuadrática (QWK) indican que el marco supera a los modelos principales existentes en el conjunto de datos del Premio Público de Evaluación Automática de Estudiantes (ASAP).
Descripción
La tarea de Puntuación Automática de Ensayos (AES) tiene como objetivo evaluar automáticamente la calidad de los trabajos a través de máquinas, reduciendo así la carga sobre los profesores y mejorando la equidad de la calificación. Aunque los modelos preentrenados se desempeñan bien en tareas de procesamiento de lenguaje natural (NLP), en el campo de AES, grandes modelos de lenguaje preentrenados como BERT no han mostrado mayores ventajas que otros modelos de aprendizaje profundo como CNN. La investigación existente a menudo ha analizado los artículos en su totalidad, ignorando las diferencias en la importancia de la información en cada parte del artículo. En respuesta a este problema, este artículo propone un nuevo marco basado en BERT, que adopta un método de ponderación de información clave a múltiples escalas, centrándose en la información importante en las escalas de token, oración, párrafo y documento para expresar de manera más efectiva el contenido semántico de las ideas principales. Además, este artículo mejora la capacidad del modelo para identificar información clave a través de técnicas de aumento de datos. Los resultados de evaluación utilizando kappa ponderada cuadrática (QWK) indican que el marco supera a los modelos principales existentes en el conjunto de datos del Premio Público de Evaluación Automática de Estudiantes (ASAP).