Pruebas de asociación basadas en datos de secuenciación de próxima generación de un grupo de marcadores genéticos para respuestas complejas utilizando un marco de modelo lineal generalizado
Autores: Xu, Zheng; Yan, Song; Wu, Cong; Duan, Qing; Chen, Sixia; Li, Yun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Pruebas de asociación basadas en datos de secuenciación de próxima generación de un grupo de marcadores genéticos para respuestas complejas utilizando un marco de modelo lineal generalizado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Relación
Variantes genéticas
Fenotipos
Pruebas de asociación
Secuenciación de próxima generación
Métodos basados en datos de NGS
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Para estudiar la relación entre variantes genéticas y fenotipos, se adopta la prueba de asociación; sin embargo, la mayoría de los estudios de asociación se realizan mediante pruebas basadas en genotipos. Los métodos de prueba basados en datos de secuenciación de próxima generación (NGS) sin llamadas de genotipo muestran una ventaja sobre los métodos de prueba basados en genotipos en los escenarios en los que la estimación del genotipo no es precisa. Nuestro objetivo fue desarrollar métodos basados en datos de NGS para estudios de asociación para llenar el vacío en la literatura. Se han propuesto métodos de prueba de un solo variante basados en datos de NGS, incluido nuestro método de prueba de un solo variante basado en datos de NGS previamente propuesto, es decir, el método UNC combo. El método de prueba de grupo basado en datos de NGS ha sido propuesto por nosotros utilizando un marco de modelo lineal que puede manejar respuestas continuas. En este documento, ampliamos nuestro marco basado en modelos lineales a un marco basado en modelos lineales generalizados para que los métodos puedan manejar otros tipos de respuestas, especialmente respuestas binarias que es un problema común en los estudios de asociación. Para evaluar el rendimiento de varios estimadores y compararlos, realizamos estudios de simulación. Encontramos que todos los métodos controlan los errores de Tipo I, y nuestros métodos basados en datos de NGS tienen un mejor rendimiento que los métodos basados en genotipos para otros tipos de respuestas, incluidas las respuestas binarias (regresión logística) y las respuestas de conteo (regresión de Poisson), especialmente cuando la profundidad de secuenciación es baja. Hemos ampliado nuestro marco de modelo lineal (LM) anterior a un marco de modelo lineal generalizado (GLM) y hemos derivado métodos basados en datos de NGS para un grupo de variables genéticas. En comparación con nuestros métodos basados en LM previamente propuestos, los nuevos métodos basados en GLM pueden manejar respuestas más complejas (por ejemplo, respuestas binarias y respuestas de conteo) además de respuestas continuas. Nuestros métodos han llenado el vacío en la literatura y han mostrado ventajas sobre sus métodos correspondientes basados en genotipos en la literatura.
Descripción
Para estudiar la relación entre variantes genéticas y fenotipos, se adopta la prueba de asociación; sin embargo, la mayoría de los estudios de asociación se realizan mediante pruebas basadas en genotipos. Los métodos de prueba basados en datos de secuenciación de próxima generación (NGS) sin llamadas de genotipo muestran una ventaja sobre los métodos de prueba basados en genotipos en los escenarios en los que la estimación del genotipo no es precisa. Nuestro objetivo fue desarrollar métodos basados en datos de NGS para estudios de asociación para llenar el vacío en la literatura. Se han propuesto métodos de prueba de un solo variante basados en datos de NGS, incluido nuestro método de prueba de un solo variante basado en datos de NGS previamente propuesto, es decir, el método UNC combo. El método de prueba de grupo basado en datos de NGS ha sido propuesto por nosotros utilizando un marco de modelo lineal que puede manejar respuestas continuas. En este documento, ampliamos nuestro marco basado en modelos lineales a un marco basado en modelos lineales generalizados para que los métodos puedan manejar otros tipos de respuestas, especialmente respuestas binarias que es un problema común en los estudios de asociación. Para evaluar el rendimiento de varios estimadores y compararlos, realizamos estudios de simulación. Encontramos que todos los métodos controlan los errores de Tipo I, y nuestros métodos basados en datos de NGS tienen un mejor rendimiento que los métodos basados en genotipos para otros tipos de respuestas, incluidas las respuestas binarias (regresión logística) y las respuestas de conteo (regresión de Poisson), especialmente cuando la profundidad de secuenciación es baja. Hemos ampliado nuestro marco de modelo lineal (LM) anterior a un marco de modelo lineal generalizado (GLM) y hemos derivado métodos basados en datos de NGS para un grupo de variables genéticas. En comparación con nuestros métodos basados en LM previamente propuestos, los nuevos métodos basados en GLM pueden manejar respuestas más complejas (por ejemplo, respuestas binarias y respuestas de conteo) además de respuestas continuas. Nuestros métodos han llenado el vacío en la literatura y han mostrado ventajas sobre sus métodos correspondientes basados en genotipos en la literatura.