Modelo gráfico gaussiano: Estimación y selección para datos incompletos de alta dimensión utilizando múltiple imputación y estimadores de herradura
Autores: Zhang, Yunxi; Kim, Soeun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Modelo gráfico gaussiano: Estimación y selección para datos incompletos de alta dimensión utilizando múltiple imputación y estimadores de herradura
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos gráficos gaussianos
Valores faltantes
Marco bayesiano
Enfoque basado en regresión
Matriz de precisión dispersa
Estimadores de herradura
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Los modelos gráficos gaussianos han sido ampliamente utilizados para medir las redes de asociación en datos de alta dimensionalidad; sin embargo, la mayoría de los métodos existentes asumen datos completamente observados. En la práctica, los valores faltantes son inevitables en datos de alta dimensionalidad y deben ser manejados cuidadosamente. Bajo el marco bayesiano, proponemos un enfoque basado en regresión para estimar una matriz de precisión dispersa para datos incompletos de alta dimensionalidad. El enfoque propuesto anida la imputación múltiple y la estimación de la matriz de precisión con estimadores de herradura en un proceso combinado de muestreo de Gibbs. Para una selección rápida y eficiente utilizando priors de herradura, se emplea una estrategia de agrupación de 2 medias después de la iteración. A través de simulaciones extensas, mostramos el rendimiento de selección y estimación predominante de nuestro enfoque en comparación con varios métodos prevalentes. Además, demostramos el enfoque propuesto en datos genéticos incompletos en comparación con métodos alternativos aplicados a datos completos.
Descripción
Los modelos gráficos gaussianos han sido ampliamente utilizados para medir las redes de asociación en datos de alta dimensionalidad; sin embargo, la mayoría de los métodos existentes asumen datos completamente observados. En la práctica, los valores faltantes son inevitables en datos de alta dimensionalidad y deben ser manejados cuidadosamente. Bajo el marco bayesiano, proponemos un enfoque basado en regresión para estimar una matriz de precisión dispersa para datos incompletos de alta dimensionalidad. El enfoque propuesto anida la imputación múltiple y la estimación de la matriz de precisión con estimadores de herradura en un proceso combinado de muestreo de Gibbs. Para una selección rápida y eficiente utilizando priors de herradura, se emplea una estrategia de agrupación de 2 medias después de la iteración. A través de simulaciones extensas, mostramos el rendimiento de selección y estimación predominante de nuestro enfoque en comparación con varios métodos prevalentes. Además, demostramos el enfoque propuesto en datos genéticos incompletos en comparación con métodos alternativos aplicados a datos completos.