Selección de variables para regresión logística escasa con variables agrupadas
Autores: Zhong, Mingrui; Yin, Zanhua; Wang, Zhichao
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Selección de variables para regresión logística escasa con variables agrupadas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Penalizado
Lasso de grupo
Esparsidad
Función de puntuación ponderada
Desigualdades de oráculo
Descenso de coordenadas de bloque
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Presentamos un nuevo método penalizado para la estimación en modelos de regresión logística dispersa con una estructura de grupo. La esparcidad de grupo implica que debemos considerar la penalización de Group Lasso. En contraste con la estimación de máxima verosimilitud penalizada, nuestro método puede ser visto como un método de función de puntuación ponderada penalizada. Bajo algunas condiciones suaves, proporcionamos desigualdades oráculo no asintóticas que promueven la esparcidad de grupo de los predictores. También se emplea un algoritmo modificado de descenso de coordenadas de bloque basado en una función de puntuación ponderada. La ventaja neta de nuestro algoritmo sobre los procedimientos existentes de tipo Group Lasso es que el parámetro de ajuste puede ser preespecificado. Las simulaciones muestran que este algoritmo es considerablemente más rápido y más estable que los métodos competidores. Finalmente, ilustramos nuestra metodología con dos conjuntos de datos reales.
Descripción
Presentamos un nuevo método penalizado para la estimación en modelos de regresión logística dispersa con una estructura de grupo. La esparcidad de grupo implica que debemos considerar la penalización de Group Lasso. En contraste con la estimación de máxima verosimilitud penalizada, nuestro método puede ser visto como un método de función de puntuación ponderada penalizada. Bajo algunas condiciones suaves, proporcionamos desigualdades oráculo no asintóticas que promueven la esparcidad de grupo de los predictores. También se emplea un algoritmo modificado de descenso de coordenadas de bloque basado en una función de puntuación ponderada. La ventaja neta de nuestro algoritmo sobre los procedimientos existentes de tipo Group Lasso es que el parámetro de ajuste puede ser preespecificado. Las simulaciones muestran que este algoritmo es considerablemente más rápido y más estable que los métodos competidores. Finalmente, ilustramos nuestra metodología con dos conjuntos de datos reales.