logo móvil
Contáctanos

Usando Modelos de Lenguaje Grande para Simular la Toma de Historia Clínica: Implicaciones para la Educación Médica Basada en Síntomas

Autores: Huh, Cheong Yoon; Lee, Jongwon; Kim, Gibaeg; Jang, Yerin; Ko, Hye-seung; Suh, Min Jung; Hwang, Sumin; Son, Ho Jin; Song, Junha; Kim, Soo-Jeong; Kim, Kwang Joon; Kim, Sung Il; Kim, Chang Oh; Ko, Yeo Gyeong

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Usando Modelos de Lenguaje Grande para Simular la Toma de Historia Clínica: Implicaciones para la Educación Médica Basada en Síntomas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Educación médica
Toma de historia clínica
Modelos de lenguaje grandes
LLMs
Gemma-3-27B
Validez clínica

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La educación médica a menudo enfatiza el conocimiento teórico, limitando las oportunidades de los estudiantes para practicar la toma de historia, una entrevista estructurada que obtiene información relevante del paciente antes de la toma de decisiones clínicas. Los modelos de lenguaje grandes (LLMs) ofrecen soluciones novedosas al generar entrevistas simuladas con pacientes. Este estudio evaluó el potencial educativo de los diálogos de toma de historia generados por LLM, centrándose en la validez clínica y la diversidad diagnóstica. Se eligió el dolor torácico como un caso representativo dada su presentación frecuente y su importancia para el diagnóstico diferencial. Se comparó un Gemma-3-27B ajustado, especializado en entrevistas médicas, con un GPT-4o-mini, un LLM de acceso gratuito, en la generación de diálogos de toma de historia de múltiples ramificaciones, con Claude-3.5 Sonnet inferiendo diagnósticos a partir de estos diálogos. Los diálogos se evaluaron utilizando una Lista de Verificación de Dolor Torácico (CPC) y métricas basadas en la entropía. Gemma-3-27B superó a GPT-4o-mini, generando significativamente más diálogos de alta calidad (90.7% frente a 76.5%). Gemma-3-27B produjo diagnósticos diversos y enfocados, mientras que GPT-4o-mini generó patrones más amplios pero menos específicos. Para la información demográfica, como la edad y el sexo, Gemma-3-27B mostró cambios significativos en los patrones de diálogo y diagnósticos alineados con las tendencias epidemiológicas del mundo real. Estos hallazgos sugieren que los LLM, particularmente aquellos ajustados para tareas médicas, son herramientas educativas prometedoras para generar escenarios de entrevistas diversos y clínicamente válidos que mejoran el razonamiento clínico en la toma de historia.

Otros recursos que podrían interesarte

Temas Virtualpro