Variational bayesiana selección de variables en regresión logística basada en Spike-and-Slab Lasso
Autores: Zhang, Juanjuan; Wang, Weixian; Yang, Mingming; Tian, Maozai
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Variational bayesiana selección de variables en regresión logística basada en Spike-and-Slab Lasso
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Regresión logística
Métodos bayesianos
Lasso de pico y pala
De alta dimensionalidad
Algoritmo bayesiano variacional
Estimación de parámetros
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
La regresión logística se usa frecuentemente para resolver problemas de clasificación. Este artículo combina las ventajas de los métodos bayesianos y el Lasso de pico y pala para seleccionar variables en regresión logística de alta dimensionalidad. El método de introducir una nueva variable oculta o aproximar el límite inferior se utiliza para resolver el problema de las funciones logísticas sin priors conjugados. La distribución Laplace en Lasso de pico y pala se expresa como una forma jerárquica de distribución normal y distribución exponencial, de modo que todos los parámetros en el modelo son distribuciones posteriores fáciles de manejar. Teniendo en cuenta el alto costo temporal de la estimación de parámetros y la selección de variables en modelos de alta dimensionalidad, utilizamos el algoritmo bayesiano variacional para realizar inferencia posterior sobre los parámetros en el modelo. A partir de los resultados de la simulación, se puede ver que es un prior adaptativo que puede realizar bien la estimación de parámetros y la selección de variables en la regresión logística de alta dimensionalidad. Desde la perspectiva del tiempo de ejecución del algoritmo, el método propuesto en este artículo también tiene una alta eficiencia computacional en muchos casos.
Descripción
La regresión logística se usa frecuentemente para resolver problemas de clasificación. Este artículo combina las ventajas de los métodos bayesianos y el Lasso de pico y pala para seleccionar variables en regresión logística de alta dimensionalidad. El método de introducir una nueva variable oculta o aproximar el límite inferior se utiliza para resolver el problema de las funciones logísticas sin priors conjugados. La distribución Laplace en Lasso de pico y pala se expresa como una forma jerárquica de distribución normal y distribución exponencial, de modo que todos los parámetros en el modelo son distribuciones posteriores fáciles de manejar. Teniendo en cuenta el alto costo temporal de la estimación de parámetros y la selección de variables en modelos de alta dimensionalidad, utilizamos el algoritmo bayesiano variacional para realizar inferencia posterior sobre los parámetros en el modelo. A partir de los resultados de la simulación, se puede ver que es un prior adaptativo que puede realizar bien la estimación de parámetros y la selección de variables en la regresión logística de alta dimensionalidad. Desde la perspectiva del tiempo de ejecución del algoritmo, el método propuesto en este artículo también tiene una alta eficiencia computacional en muchos casos.