Regresión cuantílica suavizada con selección de variables regularizadas aumentadas por factores para datos altamente correlacionados
Autores: Zhang, Yongxia; Wang, Qi; Tian, Maozai
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Regresión cuantílica suavizada con selección de variables regularizadas aumentadas por factores para datos altamente correlacionados
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudios
Selección de variables
Regresión cuantil
Distribución de colas pesadas
Correlaciones
Modelo de factor latente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Este documento estudia la selección de variables para el conjunto de datos, que tiene una distribución de colas pesadas y altas correlaciones dentro de bloques de covariables. Motivados por estudios econométricos y financieros, consideramos el uso de regresión cuantílica para modelar los datos con distribución de colas pesadas. Considerando el caso en el que las covariables son de alta dimensionalidad y hay altas correlaciones dentro de bloques, utilizamos el modelo de factor latente para reducir las correlaciones entre las covariables y utilizamos el conquistador para obtener los estimadores de los coeficientes de regresión cuantílica, y proponemos una estrategia de consistencia llamada selección de variables regularizadas aumentadas por factor para regresión cuantílica (Farvsqr). Mediante el análisis de componentes principales, podemos obtener los factores latentes y componentes idiosincráticos; luego, utilizamos ambos como predictores en lugar de las covariables con altas correlaciones. Farvsqr transforma el problema de selección de variables con covariables altamente correlacionadas a uno con débilmente correlacionadas para regresión cuantílica. La consistencia en la selección de variables se obtiene bajo condiciones leves. Estudios de simulación y aplicación de datos reales demuestran que nuestro método es mejor que la estimación LASSO regularizada común.
Descripción
Este documento estudia la selección de variables para el conjunto de datos, que tiene una distribución de colas pesadas y altas correlaciones dentro de bloques de covariables. Motivados por estudios econométricos y financieros, consideramos el uso de regresión cuantílica para modelar los datos con distribución de colas pesadas. Considerando el caso en el que las covariables son de alta dimensionalidad y hay altas correlaciones dentro de bloques, utilizamos el modelo de factor latente para reducir las correlaciones entre las covariables y utilizamos el conquistador para obtener los estimadores de los coeficientes de regresión cuantílica, y proponemos una estrategia de consistencia llamada selección de variables regularizadas aumentadas por factor para regresión cuantílica (Farvsqr). Mediante el análisis de componentes principales, podemos obtener los factores latentes y componentes idiosincráticos; luego, utilizamos ambos como predictores en lugar de las covariables con altas correlaciones. Farvsqr transforma el problema de selección de variables con covariables altamente correlacionadas a uno con débilmente correlacionadas para regresión cuantílica. La consistencia en la selección de variables se obtiene bajo condiciones leves. Estudios de simulación y aplicación de datos reales demuestran que nuestro método es mejor que la estimación LASSO regularizada común.