Pruebas de asociación de un grupo de marcadores genéticos basadas en datos de secuenciación de próxima generación y respuesta continua utilizando un marco de modelo lineal
Autores: Xu, Zheng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Pruebas de asociación de un grupo de marcadores genéticos basadas en datos de secuenciación de próxima generación y respuesta continua utilizando un marco de modelo lineal
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Prueba de asociación
Variantes genéticas
Secuenciación de próxima generación
Variable de respuesta continua
Grupo de variantes comunes
Grupo de variantes raras
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La prueba de asociación se ha utilizado ampliamente para estudiar la relación entre fenotipos y variantes genéticas. La mayoría de los métodos de prueba se basan en genotipos. Para evitar la llamada de genotipos y probar directamente en datos de secuenciación de próxima generación (NGS), se han propuesto métodos basados en datos de secuenciación y se han demostrado ventajas sobre los métodos de prueba basados en genotipos en escenarios donde la llamada de genotipos es inexacta. La mayoría de los métodos de prueba basados en datos de secuenciación se basan en un solo marcador genético. El objetivo de este documento es extender los métodos para permitir la prueba de la asociación de una variable de respuesta continua con un grupo de variantes comunes o un grupo de variantes raras sin llamar a los genotipos. Nuestros métodos propuestos se derivan en base a un marco de modelo lineal estándar. Derivamos la prueba conjunta significativa (JS) para un grupo de variables genéticas comunes y la prueba de colapso de variables (VC) para un grupo de variables genéticas raras. Hemos realizado extensos estudios de simulación para evaluar el rendimiento de diferentes estimadores. Según nuestros resultados, encontramos (1) que todos los métodos, incluidos nuestros métodos propuestos basados en datos de NGS y los métodos basados en genotipos, pueden controlar bien la probabilidad de tasa de error Tipo I; (2) nuestros métodos propuestos basados en datos de NGS pueden lograr un mejor rendimiento en términos de potencia estadística en comparación con sus métodos correspondientes basados en genotipos en la literatura; (3) cuando la profundidad de secuenciación aumenta, el rendimiento de todos los métodos aumenta y la diferencia entre el rendimiento de los métodos basados en datos de NGS y los métodos correspondientes basados en genotipos disminuye. En conclusión, hemos propuesto métodos basados en datos de NGS que permiten probar la significancia de un grupo de variantes utilizando un marco de modelo lineal y hemos mostrado la ventaja de nuestros métodos basados en datos de NGS sobre los métodos basados en genotipos en la literatura.
Descripción
La prueba de asociación se ha utilizado ampliamente para estudiar la relación entre fenotipos y variantes genéticas. La mayoría de los métodos de prueba se basan en genotipos. Para evitar la llamada de genotipos y probar directamente en datos de secuenciación de próxima generación (NGS), se han propuesto métodos basados en datos de secuenciación y se han demostrado ventajas sobre los métodos de prueba basados en genotipos en escenarios donde la llamada de genotipos es inexacta. La mayoría de los métodos de prueba basados en datos de secuenciación se basan en un solo marcador genético. El objetivo de este documento es extender los métodos para permitir la prueba de la asociación de una variable de respuesta continua con un grupo de variantes comunes o un grupo de variantes raras sin llamar a los genotipos. Nuestros métodos propuestos se derivan en base a un marco de modelo lineal estándar. Derivamos la prueba conjunta significativa (JS) para un grupo de variables genéticas comunes y la prueba de colapso de variables (VC) para un grupo de variables genéticas raras. Hemos realizado extensos estudios de simulación para evaluar el rendimiento de diferentes estimadores. Según nuestros resultados, encontramos (1) que todos los métodos, incluidos nuestros métodos propuestos basados en datos de NGS y los métodos basados en genotipos, pueden controlar bien la probabilidad de tasa de error Tipo I; (2) nuestros métodos propuestos basados en datos de NGS pueden lograr un mejor rendimiento en términos de potencia estadística en comparación con sus métodos correspondientes basados en genotipos en la literatura; (3) cuando la profundidad de secuenciación aumenta, el rendimiento de todos los métodos aumenta y la diferencia entre el rendimiento de los métodos basados en datos de NGS y los métodos correspondientes basados en genotipos disminuye. En conclusión, hemos propuesto métodos basados en datos de NGS que permiten probar la significancia de un grupo de variantes utilizando un marco de modelo lineal y hemos mostrado la ventaja de nuestros métodos basados en datos de NGS sobre los métodos basados en genotipos en la literatura.