Prueba de igualdad de varias distribuciones en dimensiones altas: un enfoque basado en discrepancia máxima-media
Autores: Ong, Zhi Peng; Chen, Aixiang Andy; Zhu, Tianming; Zhang, Jin-Ting
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Prueba de igualdad de varias distribuciones en dimensiones altas: un enfoque basado en discrepancia máxima-media
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Desarrollo
Datos de alta dimensión
Población
Discrepancia Máxima Media
Estadístico de prueba
Estudios de simulación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Con el desarrollo de técnicas modernas de recopilación de datos, los investigadores a menudo se encuentran con datos de alta dimensionalidad en diversos campos de investigación. Un problema importante es determinar si varios grupos de estos datos de alta dimensionalidad provienen de la misma población. Para abordar esto, este documento presenta una prueba novedosa de igualdad de distribuciones para datos de alta dimensionalidad, utilizando la Discrepancia Máxima de Medias (MMD). La estadística de prueba se construye utilizando un estimador basado en V-estadística de la MMD al cuadrado derivada para varias muestras. Se derivan las distribuciones nula y alternativa asintóticas de la estadística de prueba. Para aproximar la distribución nula con precisión, se describen tres métodos simples. Para evaluar el rendimiento de la prueba propuesta, se presentan dos estudios de simulación y un ejemplo de datos reales, demostrando la efectividad y confiabilidad de la prueba en aplicaciones prácticas.
Descripción
Con el desarrollo de técnicas modernas de recopilación de datos, los investigadores a menudo se encuentran con datos de alta dimensionalidad en diversos campos de investigación. Un problema importante es determinar si varios grupos de estos datos de alta dimensionalidad provienen de la misma población. Para abordar esto, este documento presenta una prueba novedosa de igualdad de distribuciones para datos de alta dimensionalidad, utilizando la Discrepancia Máxima de Medias (MMD). La estadística de prueba se construye utilizando un estimador basado en V-estadística de la MMD al cuadrado derivada para varias muestras. Se derivan las distribuciones nula y alternativa asintóticas de la estadística de prueba. Para aproximar la distribución nula con precisión, se describen tres métodos simples. Para evaluar el rendimiento de la prueba propuesta, se presentan dos estudios de simulación y un ejemplo de datos reales, demostrando la efectividad y confiabilidad de la prueba en aplicaciones prácticas.