Un algoritmo de Expectation-Maximization para combinar una muestra de matrices de covarianza parcialmente superpuestas
Autores: Akdemir, Deniz; Somo, Mohamed; Isidro-Sanchéz, Julio
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un algoritmo de Expectation-Maximization para combinar una muestra de matrices de covarianza parcialmente superpuestas
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Gestión de datos
Matrices de covarianza
Enfoque estadístico
Estimación de parámetros
Análisis multivariado
Modelado de ecuaciones estructurales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
La generación de cantidades sin precedentes de datos plantea nuevos desafíos en la gestión de datos, pero también una oportunidad para acelerar la identificación de procesos de múltiples disciplinas científicas. Uno de estos desafíos es la armonización de datos desequilibrados y heterogéneos de alta dimensionalidad. En este manuscrito, proponemos un enfoque estadístico para combinar piezas incompletas y parcialmente superpuestas de matrices de covarianza que provienen de experimentos independientes. Suponemos que los datos son una muestra aleatoria de matrices de covarianza parciales muestreadas de distribuciones Wishart y derivamos un algoritmo de expectativa-maximización para la estimación de parámetros. Demostramos las propiedades de nuestro método mediante (i) estudios de simulación y (ii) conjuntos de datos empíricos. En general, poder hacer inferencias sobre la covarianza de variables no observadas en el mismo experimento es una herramienta valiosa para el análisis de datos, ya que la estimación de la covarianza es un paso importante en muchas aplicaciones estadísticas, como el análisis multivariado, el análisis de componentes principales, el análisis factorial y el modelado de ecuaciones estructurales.
Descripción
La generación de cantidades sin precedentes de datos plantea nuevos desafíos en la gestión de datos, pero también una oportunidad para acelerar la identificación de procesos de múltiples disciplinas científicas. Uno de estos desafíos es la armonización de datos desequilibrados y heterogéneos de alta dimensionalidad. En este manuscrito, proponemos un enfoque estadístico para combinar piezas incompletas y parcialmente superpuestas de matrices de covarianza que provienen de experimentos independientes. Suponemos que los datos son una muestra aleatoria de matrices de covarianza parciales muestreadas de distribuciones Wishart y derivamos un algoritmo de expectativa-maximización para la estimación de parámetros. Demostramos las propiedades de nuestro método mediante (i) estudios de simulación y (ii) conjuntos de datos empíricos. En general, poder hacer inferencias sobre la covarianza de variables no observadas en el mismo experimento es una herramienta valiosa para el análisis de datos, ya que la estimación de la covarianza es un paso importante en muchas aplicaciones estadísticas, como el análisis multivariado, el análisis de componentes principales, el análisis factorial y el modelado de ecuaciones estructurales.