Inteligencia Artificial Multimodal en Diagnósticos Médicos
Autores: Jandoubi, Bassem; Akhloufi, Moulay A.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Inteligencia Artificial Multimodal en Diagnósticos Médicos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Inteligencia artificial
Atención médica
Enfoques multimodales
Tareas de diagnóstico
Estrategias de fusión
Arquitecturas de modelos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La integración de la inteligencia artificial en la atención médica ha avanzado rápidamente en los últimos años, con enfoques multimodales que emergen como herramientas prometedoras para mejorar la precisión diagnóstica y la toma de decisiones clínicas. Estos enfoques combinan fuentes de datos heterogéneas, como imágenes médicas, registros de salud electrónicos, señales fisiológicas y notas clínicas, para capturar mejor la complejidad de los procesos de enfermedad. A pesar de este progreso, solo un número limitado de estudios ofrece una visión unificada de las aplicaciones de IA multimodal en medicina. En esta revisión, proporcionamos un análisis completo y actualizado de arquitecturas multimodales basadas en aprendizaje automático y aprendizaje profundo, estrategias de fusión y su rendimiento en una variedad de tareas diagnósticas. Comenzamos resumiendo conjuntos de datos disponibles públicamente y examinando las tuberías de preprocesamiento requeridas para armonizar datos médicos heterogéneos. Luego, categorizamos las estrategias de fusión clave utilizadas para integrar información de múltiples modalidades y revisamos arquitecturas de modelos representativas, desde diseños híbridos y modelos de visión-lenguaje basados en transformadores hasta marcos centrados en la optimización y en los registros de salud electrónicos. Finalmente, destacamos los desafíos presentes en los trabajos existentes. Nuestro análisis muestra que los enfoques multimodales tienden a superar a los sistemas unimodales en rendimiento diagnóstico, robustez y generalización. Esta revisión proporciona una visión unificada del campo y abre futuras direcciones de investigación destinadas a construir sistemas de diagnóstico multimodal clínicamente utilizables, interpretables y escalables.
Descripción
La integración de la inteligencia artificial en la atención médica ha avanzado rápidamente en los últimos años, con enfoques multimodales que emergen como herramientas prometedoras para mejorar la precisión diagnóstica y la toma de decisiones clínicas. Estos enfoques combinan fuentes de datos heterogéneas, como imágenes médicas, registros de salud electrónicos, señales fisiológicas y notas clínicas, para capturar mejor la complejidad de los procesos de enfermedad. A pesar de este progreso, solo un número limitado de estudios ofrece una visión unificada de las aplicaciones de IA multimodal en medicina. En esta revisión, proporcionamos un análisis completo y actualizado de arquitecturas multimodales basadas en aprendizaje automático y aprendizaje profundo, estrategias de fusión y su rendimiento en una variedad de tareas diagnósticas. Comenzamos resumiendo conjuntos de datos disponibles públicamente y examinando las tuberías de preprocesamiento requeridas para armonizar datos médicos heterogéneos. Luego, categorizamos las estrategias de fusión clave utilizadas para integrar información de múltiples modalidades y revisamos arquitecturas de modelos representativas, desde diseños híbridos y modelos de visión-lenguaje basados en transformadores hasta marcos centrados en la optimización y en los registros de salud electrónicos. Finalmente, destacamos los desafíos presentes en los trabajos existentes. Nuestro análisis muestra que los enfoques multimodales tienden a superar a los sistemas unimodales en rendimiento diagnóstico, robustez y generalización. Esta revisión proporciona una visión unificada del campo y abre futuras direcciones de investigación destinadas a construir sistemas de diagnóstico multimodal clínicamente utilizables, interpretables y escalables.