logo móvil
Contáctanos

CPG-EVAL: Evaluando la Preparación de Modelos de Lenguaje Grandes como Asistentes y Compañeros en la Enseñanza de Idiomas

Autores: Wang, Dong

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

CPG-EVAL: Evaluando la Preparación de Modelos de Lenguaje Grandes como Asistentes y Compañeros en la Enseñanza de Idiomas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de lenguaje grandes
Asistentes
Compañeros de equipo
Aprendizaje de idiomas
Reconocimiento de patrones gramaticales pedagógicos
Evaluación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los modelos de lenguaje grandes (LLMs) han comenzado a funcionar como asistentes o compañeros en el aprendizaje, la enseñanza y la investigación de idiomas. Sin embargo, qué requisitos son necesarios para que los LLMs desempeñen de manera confiable estos roles, y cómo deben medirse dichos requisitos, sigue siendo un tema poco discutido. Este estudio se centra en medir el Reconocimiento de Patrones de Gramática Pedagógica (P-GPR) y establece la Evaluación de Gramática Pedagógica China (CPG-EVAL), un estándar de múltiples niveles diseñado para evaluar el P-GPR dentro de la Educación Internacional de la Lengua China. CPG-EVAL operacionaliza la correspondencia de instancias gramaticales a través de cinco tipos de tareas que aumentan progresivamente la carga contextual y la interferencia. Evaluamos múltiples LLMs de propiedad y de código abierto, así como participantes humanos. Los resultados muestran un orden monótono entre los grupos (humanos > modelos de mayor escala > modelos de semi-mayor escala > modelos de menor escala). En comparación con los participantes humanos, el rendimiento de los LLM es más sensible a la complejidad del formato de la tarea. Además, identificamos un conjunto de ítems completamente fallidos que consistentemente engañan a todos los LLM evaluados, exponiendo debilidades compartidas y sistemáticas en el reconocimiento de gramática pedagógica de los modelos actuales. En general, este estudio proporciona un marco operativo para diagnosticar las capacidades y riesgos de los LLM cuando se despliegan como asistentes o compañeros en tareas educativas relacionadas con la gramática y ofrece una referencia empírica para un uso más seguro y alineado con el plan de estudios de los LLM en entornos educativos.

Otros recursos que podrían interesarte

Temas Virtualpro