Prueba de tendencia lineal robusta para datos de secuenciación de próxima generación de baja cobertura controlando covariables
Autores: Lee, Jung Yeon; Kim, Myeong-Kyu; Kim, Wonkuk
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Prueba de tendencia lineal robusta para datos de secuenciación de próxima generación de baja cobertura controlando covariables
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Secuenciación de próxima generación
Métodos estadísticos
Estudio de asociación genética
Datos de genotipo
Tasa de error tipo I
Potencia estadística
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Los experimentos de secuenciación de próxima generación de baja cobertura asistidos por métodos estadísticos son populares en un estudio de asociación genética. Los experimentos de secuenciación de próxima generación producen datos de genotipo que incluyen recuentos de alelos y profundidades de lectura. Para profundidades de secuenciación bajas, los genotipos tienden a ser altamente inciertos; por lo tanto, los genotipos inciertos suelen eliminarse o imputarse antes de realizar un análisis estadístico. Esto puede resultar en una tasa de error tipo I inflada y en una pérdida de poder estadístico. En este artículo, proponemos una prueba de asociación de puntuación penalizada basada en una mezcla que ajusta para covariables no genéticas. La estadística de prueba de puntuación propuesta se basa en un estimador de varianza tipo sandwich para que sea robusto bajo la mala especificación del modelo entre las covariables y los genotipos latentes. El método propuesto aprovecha no requerir ni imputación externa ni eliminación de genotipos inciertos. Los resultados de nuestro estudio de simulación muestran que las tasas de error tipo I están bien controladas y que la prueba de asociación propuesta tiene un poder estadístico razonable. Como ilustración, aplicamos nuestra estadística a datos de farmacogenómica para la respuesta a medicamentos entre 400 pacientes con epilepsia.
Descripción
Los experimentos de secuenciación de próxima generación de baja cobertura asistidos por métodos estadísticos son populares en un estudio de asociación genética. Los experimentos de secuenciación de próxima generación producen datos de genotipo que incluyen recuentos de alelos y profundidades de lectura. Para profundidades de secuenciación bajas, los genotipos tienden a ser altamente inciertos; por lo tanto, los genotipos inciertos suelen eliminarse o imputarse antes de realizar un análisis estadístico. Esto puede resultar en una tasa de error tipo I inflada y en una pérdida de poder estadístico. En este artículo, proponemos una prueba de asociación de puntuación penalizada basada en una mezcla que ajusta para covariables no genéticas. La estadística de prueba de puntuación propuesta se basa en un estimador de varianza tipo sandwich para que sea robusto bajo la mala especificación del modelo entre las covariables y los genotipos latentes. El método propuesto aprovecha no requerir ni imputación externa ni eliminación de genotipos inciertos. Los resultados de nuestro estudio de simulación muestran que las tasas de error tipo I están bien controladas y que la prueba de asociación propuesta tiene un poder estadístico razonable. Como ilustración, aplicamos nuestra estadística a datos de farmacogenómica para la respuesta a medicamentos entre 400 pacientes con epilepsia.