Selección de variables para datos longitudinales de alta dimensionalidad a través de remuestreo dentro de grupos
Autores: Ma, Yue; Jiang, Xuejun
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Selección de variables para datos longitudinales de alta dimensionalidad a través de remuestreo dentro de grupos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Fenómeno
Tamaño del grupo informativo
ICS
Ecuación de estimación generalizada
Método GEE
Remuestreo dentro del grupo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
El fenómeno del tamaño del grupo informativo (ICS) emerge cuando el número de mediciones repetidas está correlacionado con la variable de resultado. En tales escenarios, el método de ecuación de estimación generalizada (GEE) predominante a menudo produce estimaciones sesgadas debido al tamaño del grupo no ignorado. Este estudio propone una metodología integrada que tiene en cuenta explícitamente el ICS y proporciona una solución robusta para mitigar sus efectos. Nuestro enfoque combina el re muestreo dentro del grupo (WCR) con un marco de verosimilitud penalizada, asegurando una selección de modelo consistente y una estimación de parámetros a través de conjuntos de datos remuestreados. Además, presentamos un método de regresión media penalizada para agregar los estimadores de múltiples conjuntos de datos remuestreados, produciendo un estimador final que mejora la tasa de descubrimiento de verdaderos positivos y controla los falsos positivos. El método de verosimilitud penalizada propuesto a través de WCR se evalúa mediante simulaciones extensas y una aplicación a datos de expresión génica del ciclo celular de levadura. Los resultados demuestran su robustez y rendimiento superior en el análisis de datos longitudinales de alta dimensión con ICS.
Descripción
El fenómeno del tamaño del grupo informativo (ICS) emerge cuando el número de mediciones repetidas está correlacionado con la variable de resultado. En tales escenarios, el método de ecuación de estimación generalizada (GEE) predominante a menudo produce estimaciones sesgadas debido al tamaño del grupo no ignorado. Este estudio propone una metodología integrada que tiene en cuenta explícitamente el ICS y proporciona una solución robusta para mitigar sus efectos. Nuestro enfoque combina el re muestreo dentro del grupo (WCR) con un marco de verosimilitud penalizada, asegurando una selección de modelo consistente y una estimación de parámetros a través de conjuntos de datos remuestreados. Además, presentamos un método de regresión media penalizada para agregar los estimadores de múltiples conjuntos de datos remuestreados, produciendo un estimador final que mejora la tasa de descubrimiento de verdaderos positivos y controla los falsos positivos. El método de verosimilitud penalizada propuesto a través de WCR se evalúa mediante simulaciones extensas y una aplicación a datos de expresión génica del ciclo celular de levadura. Los resultados demuestran su robustez y rendimiento superior en el análisis de datos longitudinales de alta dimensión con ICS.