Aprendizaje de representación de gráficos para la predicción del uso de medicamentos en el Biobanco del Reino Unido basado en variantes farmacogenéticas
Autores: Qi, Bill; Trakadis, Yannis J.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aprendizaje de representación de gráficos para la predicción del uso de medicamentos en el Biobanco del Reino Unido basado en variantes farmacogenéticas
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Tratamiento
Efectos secundarios
Aprendizaje de representación gráfica
Uso de medicamentos
Datos genéticos
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
El tratamiento ineficaz y los efectos secundarios están asociados con altas cargas para el paciente y la sociedad. Investiamos la aplicación del aprendizaje de representación de gráficos (GRL) para predecir el uso de medicamentos basado en datos genéticos individuales en el Biobanco del Reino Unido (UKBB). Se utilizó una red convolucional de gráficos (GCN) para integrar entidades biomédicas interconectadas en forma de un grafo de conocimiento como parte de un modelo de predicción de aprendizaje automático (ML). Los datos de la Base de Conocimiento de Farmacogenómica (PharmGKB) se utilizaron para construir un grafo de conocimiento biomédico. Se obtuvieron y procesaron datos genéticos individuales (n = 485,754) del UKBB para que coincidieran con variantes farmacogenéticas en el PharmGKB. Las etiquetas de uso de medicamentos autoinformadas se obtuvieron del campo de datos 20003 del UKBB. Hipotetizamos que las variantes farmacogenéticas pueden predecir el impacto de los medicamentos en los individuos. Suponemos que un individuo que usa un medicamento de forma regular experimenta un beneficio neto (vs. efectos secundarios) del medicamento. Se entrenaron modelos de ML para predecir el uso de medicamentos para 264 medicamentos. El modelo GCN superó significativamente tanto a un modelo de regresión logística de referencia (valor: 1.53 x 10) como a un modelo de red neuronal profunda (valor: 8.68 x 10). El modelo GCN también superó significativamente a un modelo GCN entrenado usando un grafo aleatorio (GCN-aleatorio) (valor: 5.44 x 10). Se observó una tendencia consistente de que los medicamentos con tamaños de muestra más grandes tenían un mejor rendimiento, y para varios medicamentos, un rango relativo alto del medicamento (entre varios medicamentos) se asociaba con más del doble de probabilidades de uso del medicamento. En conclusión, un enfoque de ML basado en gráficos podría ser útil para avanzar en la medicina de precisión al priorizar los medicamentos que un paciente pueda necesitar en función de sus datos genéticos. Sin embargo, se necesita más investigación para mejorar la calidad y cantidad de datos genéticos y validar nuestro enfoque utilizando etiquetas de medicamentos más confiables.
Descripción
El tratamiento ineficaz y los efectos secundarios están asociados con altas cargas para el paciente y la sociedad. Investiamos la aplicación del aprendizaje de representación de gráficos (GRL) para predecir el uso de medicamentos basado en datos genéticos individuales en el Biobanco del Reino Unido (UKBB). Se utilizó una red convolucional de gráficos (GCN) para integrar entidades biomédicas interconectadas en forma de un grafo de conocimiento como parte de un modelo de predicción de aprendizaje automático (ML). Los datos de la Base de Conocimiento de Farmacogenómica (PharmGKB) se utilizaron para construir un grafo de conocimiento biomédico. Se obtuvieron y procesaron datos genéticos individuales (n = 485,754) del UKBB para que coincidieran con variantes farmacogenéticas en el PharmGKB. Las etiquetas de uso de medicamentos autoinformadas se obtuvieron del campo de datos 20003 del UKBB. Hipotetizamos que las variantes farmacogenéticas pueden predecir el impacto de los medicamentos en los individuos. Suponemos que un individuo que usa un medicamento de forma regular experimenta un beneficio neto (vs. efectos secundarios) del medicamento. Se entrenaron modelos de ML para predecir el uso de medicamentos para 264 medicamentos. El modelo GCN superó significativamente tanto a un modelo de regresión logística de referencia (valor: 1.53 x 10) como a un modelo de red neuronal profunda (valor: 8.68 x 10). El modelo GCN también superó significativamente a un modelo GCN entrenado usando un grafo aleatorio (GCN-aleatorio) (valor: 5.44 x 10). Se observó una tendencia consistente de que los medicamentos con tamaños de muestra más grandes tenían un mejor rendimiento, y para varios medicamentos, un rango relativo alto del medicamento (entre varios medicamentos) se asociaba con más del doble de probabilidades de uso del medicamento. En conclusión, un enfoque de ML basado en gráficos podría ser útil para avanzar en la medicina de precisión al priorizar los medicamentos que un paciente pueda necesitar en función de sus datos genéticos. Sin embargo, se necesita más investigación para mejorar la calidad y cantidad de datos genéticos y validar nuestro enfoque utilizando etiquetas de medicamentos más confiables.