Abordando la Escasez de Datos en el Dominio Médico: Un Enfoque Basado en GPT para la Generación de Datos Sintéticos y la Extracción de Características
Autores: Sufi, Fahim
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Abordando la Escasez de Datos en el Dominio Médico: Un Enfoque Basado en GPT para la Generación de Datos Sintéticos y la Extracción de Características
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Investigación
Escasez de datos
Aprendizaje automático en medicina
Transformadores Generativos Preentrenados
Generación de datos sintéticos
Mensajes de alta de pacientes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Esta investigación enfrenta el persistente desafío de la escasez de datos en el aprendizaje automático médico al introducir una metodología pionera que aprovecha las capacidades de los Transformadores Generativos Preentrenados (GPT). En respuesta a las limitaciones impuestas por la falta de datos médicos etiquetados, nuestro enfoque implica la generación sintética de mensajes de alta calidad sobre el alta de pacientes, estableciendo un nuevo estándar en el campo con GPT generando de manera autónoma 20 campos. A través de una revisión meticulosa de la literatura existente, exploramos sistemáticamente la aptitud de GPT para la generación de datos sintéticos y la extracción de características, proporcionando una base sólida para las fases posteriores de la investigación. La demostración empírica muestra el potencial transformador de nuestra solución propuesta, presentando más de 70 mensajes de alta de pacientes con campos generados sintéticamente, incluyendo la gravedad y las posibilidades de reingreso hospitalario con justificación. Además, los datos se han implementado en una solución móvil donde algoritmos de regresión identificaron de manera autónoma los factores correlacionados para determinar la gravedad de las condiciones de los pacientes. Este estudio no solo establece una metodología novedosa y completa, sino que también contribuye significativamente al aprendizaje automático médico, presentando los resúmenes de alta de pacientes más extensos reportados en la literatura. Los resultados subrayan la eficacia de GPT para superar los desafíos de escasez de datos y allanan el camino para futuras investigaciones que refinen y amplíen la aplicación de GPT en diversos contextos médicos.
Descripción
Esta investigación enfrenta el persistente desafío de la escasez de datos en el aprendizaje automático médico al introducir una metodología pionera que aprovecha las capacidades de los Transformadores Generativos Preentrenados (GPT). En respuesta a las limitaciones impuestas por la falta de datos médicos etiquetados, nuestro enfoque implica la generación sintética de mensajes de alta calidad sobre el alta de pacientes, estableciendo un nuevo estándar en el campo con GPT generando de manera autónoma 20 campos. A través de una revisión meticulosa de la literatura existente, exploramos sistemáticamente la aptitud de GPT para la generación de datos sintéticos y la extracción de características, proporcionando una base sólida para las fases posteriores de la investigación. La demostración empírica muestra el potencial transformador de nuestra solución propuesta, presentando más de 70 mensajes de alta de pacientes con campos generados sintéticamente, incluyendo la gravedad y las posibilidades de reingreso hospitalario con justificación. Además, los datos se han implementado en una solución móvil donde algoritmos de regresión identificaron de manera autónoma los factores correlacionados para determinar la gravedad de las condiciones de los pacientes. Este estudio no solo establece una metodología novedosa y completa, sino que también contribuye significativamente al aprendizaje automático médico, presentando los resúmenes de alta de pacientes más extensos reportados en la literatura. Los resultados subrayan la eficacia de GPT para superar los desafíos de escasez de datos y allanan el camino para futuras investigaciones que refinen y amplíen la aplicación de GPT en diversos contextos médicos.