Mejora de prueba para vectores de media y matrices de covarianza de alta dimensionalidad utilizando proyección aleatoria
Autores: Wu, Tung-Lung
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Mejora de prueba para vectores de media y matrices de covarianza de alta dimensionalidad utilizando proyección aleatoria
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Enfoque propuesto
Método basado en proyección aleatoria
Vectores medios de dos muestras
Matrices de covarianza
Estrategias de agregación
Datos de expresión génica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Este trabajo propone un método mejorado basado en proyecciones aleatorias para probar vectores de medias y matrices de covarianza de dos muestras de alta dimensión. Para la prueba de medias, el enfoque propuesto incorpora datos de entrenamiento para guiar la construcción de matrices de proyección hacia la diferencia de medias estimada, mejorando sustancialmente la potencia de la estadística de Hotelling proyectada. Introducimos tres estrategias de agregación -máximo, promedio y basado en percentiles- para garantizar un rendimiento estable a través de múltiples proyecciones. Para la prueba de covarianza, el método emplea proyecciones basadas en datos alineadas con el vector propio principal de la matriz de covarianza muestral para amplificar las diferencias entre matrices. Se desarrollan estrategias de agregación -máximo, promedio y basado en percentiles- para el problema de medias y valores mínimo y promedio para el problema de covarianza, con el fin de estabilizar aún más el rendimiento a través de proyecciones repetidas. Se proporciona una aplicación a datos de expresión génica para ilustrar el método. Estudios de simulación extensos muestran que el método propuesto se desempeña favorablemente en comparación con una técnica reciente de vanguardia, especialmente en la detección de señales dispersas, manteniendo el control de la tasa de error de Tipo I.
Descripción
Este trabajo propone un método mejorado basado en proyecciones aleatorias para probar vectores de medias y matrices de covarianza de dos muestras de alta dimensión. Para la prueba de medias, el enfoque propuesto incorpora datos de entrenamiento para guiar la construcción de matrices de proyección hacia la diferencia de medias estimada, mejorando sustancialmente la potencia de la estadística de Hotelling proyectada. Introducimos tres estrategias de agregación -máximo, promedio y basado en percentiles- para garantizar un rendimiento estable a través de múltiples proyecciones. Para la prueba de covarianza, el método emplea proyecciones basadas en datos alineadas con el vector propio principal de la matriz de covarianza muestral para amplificar las diferencias entre matrices. Se desarrollan estrategias de agregación -máximo, promedio y basado en percentiles- para el problema de medias y valores mínimo y promedio para el problema de covarianza, con el fin de estabilizar aún más el rendimiento a través de proyecciones repetidas. Se proporciona una aplicación a datos de expresión génica para ilustrar el método. Estudios de simulación extensos muestran que el método propuesto se desempeña favorablemente en comparación con una técnica reciente de vanguardia, especialmente en la detección de señales dispersas, manteniendo el control de la tasa de error de Tipo I.