Reconocimiento de patrones y análisis de vías con algoritmos genéticos en metabolómica basada en espectrometría de masas
Autores: Zou, Wei; Tolstikov, Vladimir V.
Idioma: Inglés
Editor: Molecular Diversity Preservation International
Año: 2009
Acceso abierto
Artículo científico
2009
Reconocimiento de patrones y análisis de vías con algoritmos genéticos en metabolómica basada en espectrometría de masas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Flujo de trabajo
Perfilado metabólico
Minería de datos
Cromatografía
Espectrometría de masas
Algoritmos genéticos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Se describió detalladamente un flujo de trabajo robusto y completo para el perfilado metabólico y la minería de datos. Tres técnicas analíticas independientes y complementarias para el perfilado metabólico fueron aplicadas: cromatografía de interacción hidrofílica (HILIC-LC-ESI-MS), cromatografía líquida de fase inversa (RP-LC-ESI-MS) y cromatografía de gases (GC-TOF-MS), todas acopladas a espectrometría de masas (MS). Se utilizaron métodos no supervisados, como el análisis de componentes principales (PCA) y el agrupamiento, y métodos supervisados, como la clasificación y PCA-DA (análisis discriminatorio) para la minería de datos. Los Algoritmos Genéticos (GA), un enfoque multivariante, fueron investigados para la selección de los subconjuntos más pequeños de predictores potencialmente discriminativos. De entre miles de picos encontrados en total, los pequeños subconjuntos seleccionados por GA fueron considerados como predictores altamente potenciales que permiten la discriminación entre grupos. Se encontró que los pequeños grupos de principales predictores potenciales seleccionados con PCA-DA y GA son diferentes y únicos. Los datos anotados de GC-TOF-MS generados identificaron metabolitos característicos. Los metabolitos detectados presuntamente con el perfilado de LC-ESI-MS requieren una asignación adicional de composición elemental con una medición precisa de masa mediante espectrometría de resonancia de ciclotrón de transformada de Fourier (FT-ICR-MS) y una elucidación de estructura mediante espectroscopía de resonancia magnética nuclear (NMR). GA también se utilizó para generar redes correlacionadas para el análisis de vías. Varios estudios de casos, que comprenden grupos de muestras de plantas con diferentes genotipos y grupos de muestras de origen humano, a saber, muestras de orina de pacientes y voluntarios sanos, demostraron que un flujo de trabajo que combina un perfilado metabólico integral y técnicas avanzadas de minería de datos proporciona un enfoque poderoso para el reconocimiento de patrones y el descubrimiento de biomarcadores.
Descripción
Se describió detalladamente un flujo de trabajo robusto y completo para el perfilado metabólico y la minería de datos. Tres técnicas analíticas independientes y complementarias para el perfilado metabólico fueron aplicadas: cromatografía de interacción hidrofílica (HILIC-LC-ESI-MS), cromatografía líquida de fase inversa (RP-LC-ESI-MS) y cromatografía de gases (GC-TOF-MS), todas acopladas a espectrometría de masas (MS). Se utilizaron métodos no supervisados, como el análisis de componentes principales (PCA) y el agrupamiento, y métodos supervisados, como la clasificación y PCA-DA (análisis discriminatorio) para la minería de datos. Los Algoritmos Genéticos (GA), un enfoque multivariante, fueron investigados para la selección de los subconjuntos más pequeños de predictores potencialmente discriminativos. De entre miles de picos encontrados en total, los pequeños subconjuntos seleccionados por GA fueron considerados como predictores altamente potenciales que permiten la discriminación entre grupos. Se encontró que los pequeños grupos de principales predictores potenciales seleccionados con PCA-DA y GA son diferentes y únicos. Los datos anotados de GC-TOF-MS generados identificaron metabolitos característicos. Los metabolitos detectados presuntamente con el perfilado de LC-ESI-MS requieren una asignación adicional de composición elemental con una medición precisa de masa mediante espectrometría de resonancia de ciclotrón de transformada de Fourier (FT-ICR-MS) y una elucidación de estructura mediante espectroscopía de resonancia magnética nuclear (NMR). GA también se utilizó para generar redes correlacionadas para el análisis de vías. Varios estudios de casos, que comprenden grupos de muestras de plantas con diferentes genotipos y grupos de muestras de origen humano, a saber, muestras de orina de pacientes y voluntarios sanos, demostraron que un flujo de trabajo que combina un perfilado metabólico integral y técnicas avanzadas de minería de datos proporciona un enfoque poderoso para el reconocimiento de patrones y el descubrimiento de biomarcadores.