Ajuste del estimador penalizado para matriz de covarianza dispersa con datos censurados a la izquierda mediante el algoritmo EM
Autores: Lin, Shanyi; Zheng, Qian-Zhen; Shang, Laixu; Xu, Ping-Feng; Tang, Man-Lai
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Ajuste del estimador penalizado para matriz de covarianza dispersa con datos censurados a la izquierda mediante el algoritmo EM
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Matriz de covarianza dispersa
Métodos de estimación
Datos censurados a la izquierda
Estimadores de verosimilitud penalizados
Penalización SCAD
Datos incompletos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La estimación de la matriz de covarianza dispersa puede identificar de manera efectiva características y patrones importantes, y los métodos de estimación tradicionales requieren vectores de datos completos en todos los sujetos. Sin embargo, al existir datos censurados por límites de detección, estrategias comunes como excluir individuos censurados o reemplazar valores censurados con constantes adecuadas pueden resultar en sesgos importantes. En este artículo, proponemos dos estimadores de máxima verosimilitud penalizados, incorporando la penalización y la penalización SCAD, para estimar la matriz de covarianza dispersa de una distribución normal multivariante en presencia de datos censurados a la izquierda. Sin embargo, el ajuste de estos estimadores penalizados plantea desafíos debido a que la verosimilitud observada implica una integración de alta dimensionalidad sobre las variables censuradas. Para abordar este problema, tratamos los datos censurados como un caso especial de datos incompletos y empleamos el algoritmo de Expectation Maximization combinado con el algoritmo de descenso de coordenadas para ajustar eficientemente los dos estimadores penalizados. A través de estudios de simulación, demostramos que ambos estimadores penalizados logran una mayor precisión de estimación en comparación con los métodos que reemplazan los valores censurados con constantes. Además, el estimador penalizado SCAD generalmente supera al estimador penalizado. Nuestro método se utiliza para analizar los conjuntos de datos proteómicos.
Descripción
La estimación de la matriz de covarianza dispersa puede identificar de manera efectiva características y patrones importantes, y los métodos de estimación tradicionales requieren vectores de datos completos en todos los sujetos. Sin embargo, al existir datos censurados por límites de detección, estrategias comunes como excluir individuos censurados o reemplazar valores censurados con constantes adecuadas pueden resultar en sesgos importantes. En este artículo, proponemos dos estimadores de máxima verosimilitud penalizados, incorporando la penalización y la penalización SCAD, para estimar la matriz de covarianza dispersa de una distribución normal multivariante en presencia de datos censurados a la izquierda. Sin embargo, el ajuste de estos estimadores penalizados plantea desafíos debido a que la verosimilitud observada implica una integración de alta dimensionalidad sobre las variables censuradas. Para abordar este problema, tratamos los datos censurados como un caso especial de datos incompletos y empleamos el algoritmo de Expectation Maximization combinado con el algoritmo de descenso de coordenadas para ajustar eficientemente los dos estimadores penalizados. A través de estudios de simulación, demostramos que ambos estimadores penalizados logran una mayor precisión de estimación en comparación con los métodos que reemplazan los valores censurados con constantes. Además, el estimador penalizado SCAD generalmente supera al estimador penalizado. Nuestro método se utiliza para analizar los conjuntos de datos proteómicos.