Selección de variables de alta dimensionalidad para regresión cuantil basada en el método bayesiano variacional
Autores: Dai, Dengluan; Tang, Anmin; Ye, Jinli
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Selección de variables de alta dimensionalidad para regresión cuantil basada en el método bayesiano variacional
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Regresión de cuantiles
Investigación sobre la relación de variables
Alta dimensionalidad
Penalización de lasso spike-and-slab
Bayesiano variacional
Eficiencia computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El modelo de regresión de cuantiles es ampliamente utilizado en la investigación de la relación entre variables de datos de tamaño moderado, debido a su gran robustez y descripción más completa de las características de la variable de respuesta. Con el aumento del tamaño de los datos y las dimensiones de los mismos, ha habido algunos estudios sobre regresión de cuantiles de alta dimensionalidad bajo el marco estadístico clásico, incluida una perspectiva de alta eficiencia de frecuencia; sin embargo, esto conlleva el costo de la cuantificación de la aleatoriedad, o el uso de un método bayesiano de menor eficiencia basado en el muestreo MCMC. Para superar estos problemas, proponemos la regresión de cuantiles de alta dimensionalidad con una penalización de lasso de pico y pala basada en Bayes variacional (VBSSLQR), que no solo puede mejorar la eficiencia computacional, sino también medir la aleatoriedad a través de distribuciones variacionales. Estudios de simulación y análisis de datos reales ilustraron que el método propuesto VBSSLQR era superior o equivalente a otros métodos de regresión de cuantiles y no cuantiles (incluidos métodos bayesianos y no bayesianos), y su eficiencia era mayor que cualquier otro método.
Descripción
El modelo de regresión de cuantiles es ampliamente utilizado en la investigación de la relación entre variables de datos de tamaño moderado, debido a su gran robustez y descripción más completa de las características de la variable de respuesta. Con el aumento del tamaño de los datos y las dimensiones de los mismos, ha habido algunos estudios sobre regresión de cuantiles de alta dimensionalidad bajo el marco estadístico clásico, incluida una perspectiva de alta eficiencia de frecuencia; sin embargo, esto conlleva el costo de la cuantificación de la aleatoriedad, o el uso de un método bayesiano de menor eficiencia basado en el muestreo MCMC. Para superar estos problemas, proponemos la regresión de cuantiles de alta dimensionalidad con una penalización de lasso de pico y pala basada en Bayes variacional (VBSSLQR), que no solo puede mejorar la eficiencia computacional, sino también medir la aleatoriedad a través de distribuciones variacionales. Estudios de simulación y análisis de datos reales ilustraron que el método propuesto VBSSLQR era superior o equivalente a otros métodos de regresión de cuantiles y no cuantiles (incluidos métodos bayesianos y no bayesianos), y su eficiencia era mayor que cualquier otro método.