Uso de IA Generativa para Mejorar el Rendimiento y la Interpretabilidad del Diagnóstico Basado en Reglas de la Diabetes Mellitus Tipo 2
Autores: Kopitar, Leon; Fister, Iztok; Stiglic, Gregor
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Uso de IA Generativa para Mejorar el Rendimiento y la Interpretabilidad del Diagnóstico Basado en Reglas de la Diabetes Mellitus Tipo 2
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Diabetes
Aprendizaje automático
Minería de reglas de asociación
Interpretabilidad
LightGBM
GPT
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Introducción: La diabetes mellitus tipo 2 es una importante preocupación de salud global, pero interpretar modelos de aprendizaje automático para el diagnóstico sigue siendo un desafío. Este estudio investiga la combinación de minería de reglas de asociación con procesamiento de lenguaje natural avanzado para mejorar tanto la precisión diagnóstica como la interpretabilidad. Este enfoque novedoso no se ha explorado antes en el uso de transformadores preentrenados para la clasificación de diabetes en datos tabulares. Métodos: El estudio utilizó el conjunto de datos de diabetes de los indios Pima para investigar la diabetes mellitus tipo 2. Se emplearon Python y Jupyter Notebook para el análisis, con el marco NiaARM para la minería de reglas de asociación. LightGBM y el paquete dalex se utilizaron para la comparación de rendimiento y el análisis de importancia de características, respectivamente. SHAP se utilizó para la interpretabilidad local. Se utilizó OpenAI GPT versión 3.5 para la predicción de resultados y la interpretación. El código fuente está disponible en GitHub. Resultados: NiaARM generó 350 reglas para predecir la diabetes. LightGBM tuvo un mejor rendimiento que el modelo basado en GPT. Una comparación de las reglas de GPT y NiaARM mostró disparidades, lo que llevó a un análisis de puntuación de similitud. La toma de decisiones de LightGBM se basó en gran medida en la glucosa, la edad y el IMC, como se destacó en los rankings de importancia de características. Los gráficos de Beeswarm demostraron cómo los valores de las características se correlacionan con su influencia en los resultados del diagnóstico. Discusión: La combinación de minería de reglas de asociación con GPT para la clasificación de diabetes mellitus tipo 2 tiene una efectividad limitada. Se requieren mejoras como el preprocesamiento y la optimización de hiperparámetros. Los desafíos de interpretación y la dependencia de GPT en las reglas proporcionadas indican la necesidad de ingeniería de prompts y métodos de puntuación de similitud. Las variaciones en los rankings de importancia de características subrayan la complejidad de la diabetes mellitus tipo 2. Las preocupaciones sobre la fiabilidad de GPT enfatizan la importancia de enfoques iterativos para mejorar la precisión de la predicción.
Descripción
Introducción: La diabetes mellitus tipo 2 es una importante preocupación de salud global, pero interpretar modelos de aprendizaje automático para el diagnóstico sigue siendo un desafío. Este estudio investiga la combinación de minería de reglas de asociación con procesamiento de lenguaje natural avanzado para mejorar tanto la precisión diagnóstica como la interpretabilidad. Este enfoque novedoso no se ha explorado antes en el uso de transformadores preentrenados para la clasificación de diabetes en datos tabulares. Métodos: El estudio utilizó el conjunto de datos de diabetes de los indios Pima para investigar la diabetes mellitus tipo 2. Se emplearon Python y Jupyter Notebook para el análisis, con el marco NiaARM para la minería de reglas de asociación. LightGBM y el paquete dalex se utilizaron para la comparación de rendimiento y el análisis de importancia de características, respectivamente. SHAP se utilizó para la interpretabilidad local. Se utilizó OpenAI GPT versión 3.5 para la predicción de resultados y la interpretación. El código fuente está disponible en GitHub. Resultados: NiaARM generó 350 reglas para predecir la diabetes. LightGBM tuvo un mejor rendimiento que el modelo basado en GPT. Una comparación de las reglas de GPT y NiaARM mostró disparidades, lo que llevó a un análisis de puntuación de similitud. La toma de decisiones de LightGBM se basó en gran medida en la glucosa, la edad y el IMC, como se destacó en los rankings de importancia de características. Los gráficos de Beeswarm demostraron cómo los valores de las características se correlacionan con su influencia en los resultados del diagnóstico. Discusión: La combinación de minería de reglas de asociación con GPT para la clasificación de diabetes mellitus tipo 2 tiene una efectividad limitada. Se requieren mejoras como el preprocesamiento y la optimización de hiperparámetros. Los desafíos de interpretación y la dependencia de GPT en las reglas proporcionadas indican la necesidad de ingeniería de prompts y métodos de puntuación de similitud. Las variaciones en los rankings de importancia de características subrayan la complejidad de la diabetes mellitus tipo 2. Las preocupaciones sobre la fiabilidad de GPT enfatizan la importancia de enfoques iterativos para mejorar la precisión de la predicción.