CPG-EVAL: Evaluando la Preparación de Modelos de Lenguaje Grandes como Asistentes y Compañeros en la Enseñanza de Idiomas

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

CPG-EVAL: Evaluando la Preparación de Modelos de Lenguaje Grandes como Asistentes y Compañeros en la Enseñanza de Idiomas

Autores: Wang, Dong

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico

2026

CPG-EVAL: Evaluando la Preparación de Modelos de Lenguaje Grandes como Asistentes y Compañeros en la Enseñanza de Idiomas

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de lenguaje grandes

Asistentes

Compañeros de equipo

Aprendizaje de idiomas

Reconocimiento de patrones gramaticales pedagógicos

Evaluación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Los modelos de lenguaje grandes (LLMs) han comenzado a funcionar como asistentes o compañeros en el aprendizaje, la enseñanza y la investigación de idiomas. Sin embargo, qué requisitos son necesarios para que los LLMs desempeñen de manera confiable estos roles, y cómo deben medirse dichos requisitos, sigue siendo un tema poco discutido. Este estudio se centra en medir el Reconocimiento de Patrones de Gramática Pedagógica (P-GPR) y establece la Evaluación de Gramática Pedagógica China (CPG-EVAL), un estándar de múltiples niveles diseñado para evaluar el P-GPR dentro de la Educación Internacional de la Lengua China. CPG-EVAL operacionaliza la correspondencia de instancias gramaticales a través de cinco tipos de tareas que aumentan progresivamente la carga contextual y la interferencia. Evaluamos múltiples LLMs de propiedad y de código abierto, así como participantes humanos. Los resultados muestran un orden monótono entre los grupos (humanos > modelos de mayor escala > modelos de semi-mayor escala > modelos de menor escala). En comparación con los participantes humanos, el rendimiento de los LLM es más sensible a la complejidad del formato de la tarea. Además, identificamos un conjunto de ítems completamente fallidos que consistentemente engañan a todos los LLM evaluados, exponiendo debilidades compartidas y sistemáticas en el reconocimiento de gramática pedagógica de los modelos actuales. En general, este estudio proporciona un marco operativo para diagnosticar las capacidades y riesgos de los LLM cuando se despliegan como asistentes o compañeros en tareas educativas relacionadas con la gramática y ofrece una referencia empírica para un uso más seguro y alineado con el plan de estudios de los LLM en entornos educativos.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro