Prueba de informatividad de tamaños de grupo inducidos por covariables en datos agrupados
Autores: Senevirathne, Hasika K. Wickrama; Dutta, Sandipan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Prueba de informatividad de tamaños de grupo inducidos por covariables en datos agrupados
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos agrupados
Tamaño de grupo informativo
ICS
Tamaño de grupo intra-cluster
IICGS
Mecanismo de prueba de hipótesis estadística
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Los datos agrupados son un tipo especial de datos correlacionados donde las unidades dentro de un grupo están correlacionadas mientras que las unidades entre diferentes grupos son independientes. El número de unidades en un grupo puede estar asociado con el resultado de ese grupo. Esto se llama tamaño de grupo informativo (ICS), que se sabe que impacta en la inferencia de datos agrupados. Sin embargo, al comparar los resultados de múltiples grupos de unidades en datos agrupados, investigar el ICS puede no ser suficiente. Esto se debe a que el número de unidades pertenecientes a un grupo particular en un grupo puede estar asociado con el resultado de ese grupo en ese grupo, lo que lleva a un tamaño de grupo intra-cluster informativo o IICGS. Este fenómeno de IICGS puede existir incluso en ausencia de ICS. Ignorar la existencia de IICGS puede resultar en una inferencia sesgada para comparaciones de resultados basadas en grupos en datos agrupados. En este artículo, formulamos matemáticamente el concepto de IICGS mientras lo distinguimos de ICS y proponemos un mecanismo de prueba de hipótesis estadísticas basado en el bootstrap no paramétrico para probar cualquier afirmación de IICGS en un entorno de datos agrupados. A través de simulaciones y aplicaciones de datos reales, demostramos que nuestro método de prueba estadística propuesto puede identificar con precisión IICGS, con un poder sustancial, en datos agrupados.
Descripción
Los datos agrupados son un tipo especial de datos correlacionados donde las unidades dentro de un grupo están correlacionadas mientras que las unidades entre diferentes grupos son independientes. El número de unidades en un grupo puede estar asociado con el resultado de ese grupo. Esto se llama tamaño de grupo informativo (ICS), que se sabe que impacta en la inferencia de datos agrupados. Sin embargo, al comparar los resultados de múltiples grupos de unidades en datos agrupados, investigar el ICS puede no ser suficiente. Esto se debe a que el número de unidades pertenecientes a un grupo particular en un grupo puede estar asociado con el resultado de ese grupo en ese grupo, lo que lleva a un tamaño de grupo intra-cluster informativo o IICGS. Este fenómeno de IICGS puede existir incluso en ausencia de ICS. Ignorar la existencia de IICGS puede resultar en una inferencia sesgada para comparaciones de resultados basadas en grupos en datos agrupados. En este artículo, formulamos matemáticamente el concepto de IICGS mientras lo distinguimos de ICS y proponemos un mecanismo de prueba de hipótesis estadísticas basado en el bootstrap no paramétrico para probar cualquier afirmación de IICGS en un entorno de datos agrupados. A través de simulaciones y aplicaciones de datos reales, demostramos que nuestro método de prueba estadística propuesto puede identificar con precisión IICGS, con un poder sustancial, en datos agrupados.