Minimizando discrepancias de cohortes: un análisis comparativo de enfoques de normalización de datos en la investigación de biomarcadores
Autores: Tokareva, Alisa; Starodubtseva, Natalia; Frankevich, Vladimir; Silachev, Denis
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Minimizando discrepancias de cohortes: un análisis comparativo de enfoques de normalización de datos en la investigación de biomarcadores
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Varianza biológica
Métodos de normalización basados en datos
Datos del metaboloma
Mínimos cuadrados parciales ortogonales
Biomarcadores potenciales
VSN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
La varianza biológica entre las muestras de diferentes cohortes puede plantear desafíos para la validación a largo plazo de los modelos desarrollados. Los métodos de normalización basados en datos ofrecen herramientas prometedoras para mitigar la varianza biológica entre muestras. Aplicamos siete métodos de normalización basados en datos a datos cuantitativos del metaboloma extraídos de manchas de sangre seca de ratas en el contexto del modelo de encefalopatía hipóxico-isquémica (HIE) de Rice-Vannucci en ratas. La calidad de la normalización se evaluó a través del rendimiento de los modelos de Ortogonal de Mínimos Cuadrados Parciales (OPLS) construidos en los conjuntos de datos de entrenamiento; la sensibilidad y especificidad de estos modelos se calcularon mediante la aplicación a los conjuntos de datos de validación. PQN, MRN y VSN demostraron una mayor calidad diagnóstica de los modelos de OPLS que los otros métodos estudiados. El modelo de OPLS basado en VSN mostró un rendimiento superior (86% de sensibilidad y 77% de especificidad). Después de VSN, los biomarcadores potenciales identificados por VIP divergieron notablemente de los identificados utilizando otros métodos de normalización. La glicina surgió consistentemente como el marcador principal en seis de los siete modelos, alineándose perfectamente con nuestros hallazgos de investigación previos. Del mismo modo, la alanina exhibió un patrón similar. Destacadamente, VSN resaltó de manera única vías relacionadas con la oxidación de ácidos grasos cerebrales y el metabolismo de las purinas. Nuestros hallazgos subrayan la utilidad generalizada de VSN en metabolómica, sugiriendo su potencial para su uso en investigaciones a gran escala y estudios interdisciplinarios.
Descripción
La varianza biológica entre las muestras de diferentes cohortes puede plantear desafíos para la validación a largo plazo de los modelos desarrollados. Los métodos de normalización basados en datos ofrecen herramientas prometedoras para mitigar la varianza biológica entre muestras. Aplicamos siete métodos de normalización basados en datos a datos cuantitativos del metaboloma extraídos de manchas de sangre seca de ratas en el contexto del modelo de encefalopatía hipóxico-isquémica (HIE) de Rice-Vannucci en ratas. La calidad de la normalización se evaluó a través del rendimiento de los modelos de Ortogonal de Mínimos Cuadrados Parciales (OPLS) construidos en los conjuntos de datos de entrenamiento; la sensibilidad y especificidad de estos modelos se calcularon mediante la aplicación a los conjuntos de datos de validación. PQN, MRN y VSN demostraron una mayor calidad diagnóstica de los modelos de OPLS que los otros métodos estudiados. El modelo de OPLS basado en VSN mostró un rendimiento superior (86% de sensibilidad y 77% de especificidad). Después de VSN, los biomarcadores potenciales identificados por VIP divergieron notablemente de los identificados utilizando otros métodos de normalización. La glicina surgió consistentemente como el marcador principal en seis de los siete modelos, alineándose perfectamente con nuestros hallazgos de investigación previos. Del mismo modo, la alanina exhibió un patrón similar. Destacadamente, VSN resaltó de manera única vías relacionadas con la oxidación de ácidos grasos cerebrales y el metabolismo de las purinas. Nuestros hallazgos subrayan la utilidad generalizada de VSN en metabolómica, sugiriendo su potencial para su uso en investigaciones a gran escala y estudios interdisciplinarios.