Una Revisión Sistemática de Modelos de Lenguaje Grande en Especialidades Médicas: Aplicaciones, Desafíos y Direcciones Futuras
Autores: Alkalbani, Asma Musabah; Alrawahi, Ahmed Salim; Salah, Ahmad; Haghighi, Venus; Zhang, Yang; Alkindi, Salam; Sheng, Quan Z.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Una Revisión Sistemática de Modelos de Lenguaje Grande en Especialidades Médicas: Aplicaciones, Desafíos y Direcciones Futuras
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelo de lenguaje
Especialidades médicas
Procesamiento de lenguaje natural
Procesos de diagnóstico
Implicaciones éticas
Consistencia en el rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Esta revisión sistemática evalúa la literatura reciente desde enero de 2021 hasta marzo de 2024 sobre las aplicaciones de modelos de lenguaje grande (LLM) en diversas especialidades médicas. Al buscar en PubMed, Web of Science y Scopus, incluimos 84 estudios. Los LLM se aplicaron a tareas como el procesamiento de lenguaje natural clínico, el apoyo a la decisión médica, la educación y la ayuda en procesos diagnósticos. Si bien los estudios informaron beneficios como una mayor eficiencia y, en algunas tareas específicas de PLN, una alta precisión superior al 90%, persisten desafíos significativos en cuanto a la fiabilidad, las implicaciones éticas y la consistencia del rendimiento, con una precisión en aplicaciones de apoyo diagnóstico más amplias que muestra una variabilidad sustancial, con algunos tan bajos como el 3%. El riesgo general de sesgo en la literatura revisada fue considerablemente bajo en 72 estudios. Los hallazgos clave destacan una heterogeneidad sustancial en el rendimiento de los LLM en diferentes tareas y contextos médicos, lo que impide el meta-análisis debido a la falta de metodologías estandarizadas. Los esfuerzos futuros deberían priorizar el desarrollo de LLM específicos para cada dominio utilizando datos médicos robustos y establecer estándares de validación rigurosos para garantizar su integración clínica segura y efectiva. Registro del ensayo: PROSPERO (CRD42024561381).
Descripción
Esta revisión sistemática evalúa la literatura reciente desde enero de 2021 hasta marzo de 2024 sobre las aplicaciones de modelos de lenguaje grande (LLM) en diversas especialidades médicas. Al buscar en PubMed, Web of Science y Scopus, incluimos 84 estudios. Los LLM se aplicaron a tareas como el procesamiento de lenguaje natural clínico, el apoyo a la decisión médica, la educación y la ayuda en procesos diagnósticos. Si bien los estudios informaron beneficios como una mayor eficiencia y, en algunas tareas específicas de PLN, una alta precisión superior al 90%, persisten desafíos significativos en cuanto a la fiabilidad, las implicaciones éticas y la consistencia del rendimiento, con una precisión en aplicaciones de apoyo diagnóstico más amplias que muestra una variabilidad sustancial, con algunos tan bajos como el 3%. El riesgo general de sesgo en la literatura revisada fue considerablemente bajo en 72 estudios. Los hallazgos clave destacan una heterogeneidad sustancial en el rendimiento de los LLM en diferentes tareas y contextos médicos, lo que impide el meta-análisis debido a la falta de metodologías estandarizadas. Los esfuerzos futuros deberían priorizar el desarrollo de LLM específicos para cada dominio utilizando datos médicos robustos y establecer estándares de validación rigurosos para garantizar su integración clínica segura y efectiva. Registro del ensayo: PROSPERO (CRD42024561381).