Usando Modelos de Lenguaje Grande para Simular la Toma de Historia Clínica: Implicaciones para la Educación Médica Basada en Síntomas
Autores: Huh, Cheong Yoon; Lee, Jongwon; Kim, Gibaeg; Jang, Yerin; Ko, Hye-seung; Suh, Min Jung; Hwang, Sumin; Son, Ho Jin; Song, Junha; Kim, Soo-Jeong; Kim, Kwang Joon; Kim, Sung Il; Kim, Chang Oh; Ko, Yeo Gyeong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Usando Modelos de Lenguaje Grande para Simular la Toma de Historia Clínica: Implicaciones para la Educación Médica Basada en Síntomas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Educación médica
Toma de historia clínica
Modelos de lenguaje grandes
LLMs
Gemma-3-27B
Validez clínica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La educación médica a menudo enfatiza el conocimiento teórico, limitando las oportunidades de los estudiantes para practicar la toma de historia, una entrevista estructurada que obtiene información relevante del paciente antes de la toma de decisiones clínicas. Los modelos de lenguaje grandes (LLMs) ofrecen soluciones novedosas al generar entrevistas simuladas con pacientes. Este estudio evaluó el potencial educativo de los diálogos de toma de historia generados por LLM, centrándose en la validez clínica y la diversidad diagnóstica. Se eligió el dolor torácico como un caso representativo dada su presentación frecuente y su importancia para el diagnóstico diferencial. Se comparó un Gemma-3-27B ajustado, especializado en entrevistas médicas, con un GPT-4o-mini, un LLM de acceso gratuito, en la generación de diálogos de toma de historia de múltiples ramificaciones, con Claude-3.5 Sonnet inferiendo diagnósticos a partir de estos diálogos. Los diálogos se evaluaron utilizando una Lista de Verificación de Dolor Torácico (CPC) y métricas basadas en la entropía. Gemma-3-27B superó a GPT-4o-mini, generando significativamente más diálogos de alta calidad (90.7% frente a 76.5%). Gemma-3-27B produjo diagnósticos diversos y enfocados, mientras que GPT-4o-mini generó patrones más amplios pero menos específicos. Para la información demográfica, como la edad y el sexo, Gemma-3-27B mostró cambios significativos en los patrones de diálogo y diagnósticos alineados con las tendencias epidemiológicas del mundo real. Estos hallazgos sugieren que los LLM, particularmente aquellos ajustados para tareas médicas, son herramientas educativas prometedoras para generar escenarios de entrevistas diversos y clínicamente válidos que mejoran el razonamiento clínico en la toma de historia.
Descripción
La educación médica a menudo enfatiza el conocimiento teórico, limitando las oportunidades de los estudiantes para practicar la toma de historia, una entrevista estructurada que obtiene información relevante del paciente antes de la toma de decisiones clínicas. Los modelos de lenguaje grandes (LLMs) ofrecen soluciones novedosas al generar entrevistas simuladas con pacientes. Este estudio evaluó el potencial educativo de los diálogos de toma de historia generados por LLM, centrándose en la validez clínica y la diversidad diagnóstica. Se eligió el dolor torácico como un caso representativo dada su presentación frecuente y su importancia para el diagnóstico diferencial. Se comparó un Gemma-3-27B ajustado, especializado en entrevistas médicas, con un GPT-4o-mini, un LLM de acceso gratuito, en la generación de diálogos de toma de historia de múltiples ramificaciones, con Claude-3.5 Sonnet inferiendo diagnósticos a partir de estos diálogos. Los diálogos se evaluaron utilizando una Lista de Verificación de Dolor Torácico (CPC) y métricas basadas en la entropía. Gemma-3-27B superó a GPT-4o-mini, generando significativamente más diálogos de alta calidad (90.7% frente a 76.5%). Gemma-3-27B produjo diagnósticos diversos y enfocados, mientras que GPT-4o-mini generó patrones más amplios pero menos específicos. Para la información demográfica, como la edad y el sexo, Gemma-3-27B mostró cambios significativos en los patrones de diálogo y diagnósticos alineados con las tendencias epidemiológicas del mundo real. Estos hallazgos sugieren que los LLM, particularmente aquellos ajustados para tareas médicas, son herramientas educativas prometedoras para generar escenarios de entrevistas diversos y clínicamente válidos que mejoran el razonamiento clínico en la toma de historia.