Prueba multivariante adaptativa de datos para estudios genómicos utilizando Lasso fusionado
Autores: Ueki, Masao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Prueba multivariante adaptativa de datos para estudios genómicos utilizando Lasso fusionado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudios genómicos
Análisis univariado
Análisis multivariado
Pruebas adaptativas de datos
Modelos de regresión
Lasso fusionado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
En los estudios genómicos, el análisis univariado se utiliza comúnmente para descubrir variantes susceptibles. Aplica regresión univariada para cada variante y prueba la significancia del coeficiente de regresión o parámetro de pendiente. Sin embargo, esta estrategia puede perder señales que son detectables conjuntamente con otras variantes. El análisis multivariado es otro enfoque popular, que prueba variantes agrupadas con un grupo predefinido, por ejemplo, basado en un gen, vía o ubicación física. Sin embargo, el poder se verá disminuido si la suposición de modelado no es adecuada para los datos. Por lo tanto, las pruebas adaptativas a los datos que se basan en menos suposiciones de modelado son preferibles. Los enfoques posibles incluyen una prueba adaptativa a los datos propuesta por Ueki (2021), que se aplica a varios modelos de regresión adaptativos a los datos utilizando una generalización del coeficiente de determinación generalizado de Yanai. Si bien varios modelos de regresión son opciones posibles para la prueba adaptativa a los datos, este documento se centra en el lasso fusionado que puede tener en cuenta el efecto de variantes adyacentes e investiga su rendimiento mediante la comparación con otras pruebas existentes. Los estudios de simulación demuestran que la prueba utilizando lasso fusionado tiene un alto poder en comparación con las pruebas existentes, incluida la prueba de regresión univariada, la prueba de regresión saturada, SKAT (prueba de asociación de núcleo de secuencia), prueba de carga, SKAT-O (prueba de asociación de núcleo de secuencia optimizada) y las pruebas que utilizan lasso, ridge y red elástica al asumir un efecto similar de variantes adyacentes.
Descripción
En los estudios genómicos, el análisis univariado se utiliza comúnmente para descubrir variantes susceptibles. Aplica regresión univariada para cada variante y prueba la significancia del coeficiente de regresión o parámetro de pendiente. Sin embargo, esta estrategia puede perder señales que son detectables conjuntamente con otras variantes. El análisis multivariado es otro enfoque popular, que prueba variantes agrupadas con un grupo predefinido, por ejemplo, basado en un gen, vía o ubicación física. Sin embargo, el poder se verá disminuido si la suposición de modelado no es adecuada para los datos. Por lo tanto, las pruebas adaptativas a los datos que se basan en menos suposiciones de modelado son preferibles. Los enfoques posibles incluyen una prueba adaptativa a los datos propuesta por Ueki (2021), que se aplica a varios modelos de regresión adaptativos a los datos utilizando una generalización del coeficiente de determinación generalizado de Yanai. Si bien varios modelos de regresión son opciones posibles para la prueba adaptativa a los datos, este documento se centra en el lasso fusionado que puede tener en cuenta el efecto de variantes adyacentes e investiga su rendimiento mediante la comparación con otras pruebas existentes. Los estudios de simulación demuestran que la prueba utilizando lasso fusionado tiene un alto poder en comparación con las pruebas existentes, incluida la prueba de regresión univariada, la prueba de regresión saturada, SKAT (prueba de asociación de núcleo de secuencia), prueba de carga, SKAT-O (prueba de asociación de núcleo de secuencia optimizada) y las pruebas que utilizan lasso, ridge y red elástica al asumir un efecto similar de variantes adyacentes.