Estimación confiable de correlación genética mediante división y suavizado de múltiples muestras
Autores: Mai, The Tien
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estimación confiable de correlación genética mediante división y suavizado de múltiples muestras
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Investigar
Correlación genética
Modelo lineal de alta dimensionalidad
Métodos de penalización dispersa
Enfoques de división de muestras múltiples
Aplicaciones del mundo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
En este documento, nuestro objetivo es investigar el problema de estimar la correlación genética entre dos rasgos. En lugar de hacer suposiciones sobre la distribución de los tamaños de efecto de los factores genéticos, proponemos el uso de un modelo lineal de alta dimensionalidad para relacionar un rasgo con factores genéticos. Para estimar la correlación genética, desarrollamos una estrategia genérica que combina el uso de métodos de penalización escasos y enfoques de partición de múltiples muestras. La estimación final se determina tomando la mediana de los cálculos, lo que resulta en una estimación suavizada y confiable. A través de simulaciones, demostramos que nuestro enfoque propuesto es confiable y preciso en comparación con los métodos de inserción ingenuos. Para ilustrar aún más las ventajas de nuestro método, lo aplicamos a un ejemplo del mundo real de un conjunto de datos de GWAS bacterianos, específicamente para estimar la correlación genética entre rasgos resistentes a antibióticos en . Esta aplicación no solo valida la efectividad de nuestro método, sino que también destaca su potencial en aplicaciones del mundo real.
Descripción
En este documento, nuestro objetivo es investigar el problema de estimar la correlación genética entre dos rasgos. En lugar de hacer suposiciones sobre la distribución de los tamaños de efecto de los factores genéticos, proponemos el uso de un modelo lineal de alta dimensionalidad para relacionar un rasgo con factores genéticos. Para estimar la correlación genética, desarrollamos una estrategia genérica que combina el uso de métodos de penalización escasos y enfoques de partición de múltiples muestras. La estimación final se determina tomando la mediana de los cálculos, lo que resulta en una estimación suavizada y confiable. A través de simulaciones, demostramos que nuestro enfoque propuesto es confiable y preciso en comparación con los métodos de inserción ingenuos. Para ilustrar aún más las ventajas de nuestro método, lo aplicamos a un ejemplo del mundo real de un conjunto de datos de GWAS bacterianos, específicamente para estimar la correlación genética entre rasgos resistentes a antibióticos en . Esta aplicación no solo valida la efectividad de nuestro método, sino que también destaca su potencial en aplicaciones del mundo real.