LessonAgent: Un pipeline multimodal para la generación automatizada de planes de lecciones, presentaciones y pódcast
Autores: Quan, Jinhao; Ouyang, Yong; Wang, Huanwen; Wang, Yuanlin
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
LessonAgent: Un pipeline multimodal para la generación automatizada de planes de lecciones, presentaciones y pódcast
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Preparación de lecciones
Proceso de enseñanza
Tecnología
Materiales de lección
Multimodal
Satisfacción del docente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La preparación de lecciones juega un papel crucial en la estructuración y organización del proceso de enseñanza. Sin embargo, el diseño tradicional de lecciones y la creación de presentaciones requieren que los docentes dediquen una cantidad considerable de tiempo a revisar la literatura y organizar materiales. Por lo tanto, desarrollar una tecnología inteligente y multimodal capaz de generar automáticamente materiales de lección tiene una gran importancia. Tal tecnología puede reducir potencialmente la carga de trabajo de los docentes y mejorar la eficiencia y calidad de la preparación de lecciones, como lo indican la satisfacción de los docentes y los juicios de preferencia. En este documento, presentamos LessonAgent, un pipeline multimodal e interactivo que aprovecha grandes modelos de lenguaje (LLMs) para generar planes de lecciones, presentaciones y pódcast. Nuestro sistema mejora la calidad de los materiales generados a través de diversas modalidades de entrada, mecanismos de generación refinados y retroalimentación interactiva con los docentes. Específicamente, presentamos el conjunto de datos Plan10k, una colección bilingüe de alta calidad de planes de lecciones, y lo empleamos para entrenar y evaluar nuestro marco. El pipeline consta de tres módulos principales: un módulo de reescritura de consultas que maneja entradas multimodales de los docentes (por ejemplo, conceptos textuales, imágenes o extractos de libros de texto), un módulo de generación de planes de lecciones que produce contenido estructurado, y un módulo de corrección de capítulos que integra herramientas basadas en recuperación para mejorar la precisión fáctica y la relevancia contextual. Además, los docentes pueden interactuar con los resultados intermedios, lo que permite un refinamiento adaptativo a lo largo del proceso de generación. Basado en los planes de lecciones generados, el marco produce además presentaciones visuales y pódcast correspondientes, formando un sistema integral de asistente de enseñanza multimodal. Experimentos extensos y evaluaciones de docentes demuestran el rendimiento superior y la satisfacción de nuestro enfoque.
Descripción
La preparación de lecciones juega un papel crucial en la estructuración y organización del proceso de enseñanza. Sin embargo, el diseño tradicional de lecciones y la creación de presentaciones requieren que los docentes dediquen una cantidad considerable de tiempo a revisar la literatura y organizar materiales. Por lo tanto, desarrollar una tecnología inteligente y multimodal capaz de generar automáticamente materiales de lección tiene una gran importancia. Tal tecnología puede reducir potencialmente la carga de trabajo de los docentes y mejorar la eficiencia y calidad de la preparación de lecciones, como lo indican la satisfacción de los docentes y los juicios de preferencia. En este documento, presentamos LessonAgent, un pipeline multimodal e interactivo que aprovecha grandes modelos de lenguaje (LLMs) para generar planes de lecciones, presentaciones y pódcast. Nuestro sistema mejora la calidad de los materiales generados a través de diversas modalidades de entrada, mecanismos de generación refinados y retroalimentación interactiva con los docentes. Específicamente, presentamos el conjunto de datos Plan10k, una colección bilingüe de alta calidad de planes de lecciones, y lo empleamos para entrenar y evaluar nuestro marco. El pipeline consta de tres módulos principales: un módulo de reescritura de consultas que maneja entradas multimodales de los docentes (por ejemplo, conceptos textuales, imágenes o extractos de libros de texto), un módulo de generación de planes de lecciones que produce contenido estructurado, y un módulo de corrección de capítulos que integra herramientas basadas en recuperación para mejorar la precisión fáctica y la relevancia contextual. Además, los docentes pueden interactuar con los resultados intermedios, lo que permite un refinamiento adaptativo a lo largo del proceso de generación. Basado en los planes de lecciones generados, el marco produce además presentaciones visuales y pódcast correspondientes, formando un sistema integral de asistente de enseñanza multimodal. Experimentos extensos y evaluaciones de docentes demuestran el rendimiento superior y la satisfacción de nuestro enfoque.