Regresiones de datos de conteo sobredispersos heterogéneos a través de estimaciones de doble penalización
Autores: Li, Shaomin; Wei, Haoyu; Lei, Xiaoyu
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Regresiones de datos de conteo sobredispersos heterogéneos a través de estimaciones de doble penalización
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Regresión binomial negativa de alta dimensionalidad
Estimación de dispersión
Selección de variables
Modelos heterogéneos
Estimadores lasso
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Recientemente, la regresión binomial negativa de alta dimensionalidad (NBR) para datos de recuento ha sido ampliamente utilizada en muchos campos científicos. Sin embargo, la mayoría de los estudios asumieron el parámetro de dispersión como una constante, lo cual puede no cumplirse en la práctica. Este artículo estudia la selección de variables y la estimación de dispersión para los modelos NBR heterogéneos, que modelan el parámetro de dispersión como una función. Específicamente, propusimos una regresión doble y aplicamos una doble penalización a ambas regresiones. Bajo las condiciones de autovalores restringidos, demostramos las desigualdades del oráculo para los estimadores de lasso de dos coeficientes de regresión parciales por primera vez, utilizando desigualdades de concentración de procesos empíricos. Además, derivadas de las desigualdades del oráculo, la consistencia y la tasa de convergencia de los estimadores son las garantías teóricas para una inferencia estadística adicional. Finalmente, tanto las simulaciones como un análisis de datos reales demuestran que los nuevos métodos son efectivos.
Descripción
Recientemente, la regresión binomial negativa de alta dimensionalidad (NBR) para datos de recuento ha sido ampliamente utilizada en muchos campos científicos. Sin embargo, la mayoría de los estudios asumieron el parámetro de dispersión como una constante, lo cual puede no cumplirse en la práctica. Este artículo estudia la selección de variables y la estimación de dispersión para los modelos NBR heterogéneos, que modelan el parámetro de dispersión como una función. Específicamente, propusimos una regresión doble y aplicamos una doble penalización a ambas regresiones. Bajo las condiciones de autovalores restringidos, demostramos las desigualdades del oráculo para los estimadores de lasso de dos coeficientes de regresión parciales por primera vez, utilizando desigualdades de concentración de procesos empíricos. Además, derivadas de las desigualdades del oráculo, la consistencia y la tasa de convergencia de los estimadores son las garantías teóricas para una inferencia estadística adicional. Finalmente, tanto las simulaciones como un análisis de datos reales demuestran que los nuevos métodos son efectivos.