Un resumen selectivo de la regresión cuantil para datos a gran escala
Autores: Wang, Shanshan; Cao, Wei; Hu, Xiaoxue; Zhong, Hanyu; Sun, Weixi
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un resumen selectivo de la regresión cuantil para datos a gran escala
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos a gran escala
Regresión de cuantiles
Heterocedasticidad
Computación distribuida
Métodos de submuestreo
Actualización en línea
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Los datos a gran escala, caracterizados por la heterogeneidad debido a la varianza heterocedástica o a efectos de covariables no homogéneos, surgen en diversos campos de investigación científica y desarrollo tecnológico. La regresión de cuantiles (QR) es una herramienta valiosa para detectar la heterocedasticidad, y numerosos métodos estadísticos de QR para datos a gran escala se han desarrollado rápidamente. Este documento proporciona una revisión selectiva de los avances recientes en la teoría, métodos e implementaciones de QR, particularmente en el contexto de datos masivos y en continuo flujo. Nos enfocamos en tres estrategias clave para el análisis de QR a gran escala: (1) computación distribuida, (2) métodos de submuestreo y (3) actualización en línea. La principal contribución de este documento es una revisión exhaustiva del trabajo existente y los avances en estas áreas, abordando desafíos como manejar la función de pérdida QR no suave, desarrollar formulaciones distribuidas y de actualización en línea, y realizar inferencias estadísticas. Finalmente, resaltamos varios problemas que requieren un estudio adicional.
Descripción
Los datos a gran escala, caracterizados por la heterogeneidad debido a la varianza heterocedástica o a efectos de covariables no homogéneos, surgen en diversos campos de investigación científica y desarrollo tecnológico. La regresión de cuantiles (QR) es una herramienta valiosa para detectar la heterocedasticidad, y numerosos métodos estadísticos de QR para datos a gran escala se han desarrollado rápidamente. Este documento proporciona una revisión selectiva de los avances recientes en la teoría, métodos e implementaciones de QR, particularmente en el contexto de datos masivos y en continuo flujo. Nos enfocamos en tres estrategias clave para el análisis de QR a gran escala: (1) computación distribuida, (2) métodos de submuestreo y (3) actualización en línea. La principal contribución de este documento es una revisión exhaustiva del trabajo existente y los avances en estas áreas, abordando desafíos como manejar la función de pérdida QR no suave, desarrollar formulaciones distribuidas y de actualización en línea, y realizar inferencias estadísticas. Finalmente, resaltamos varios problemas que requieren un estudio adicional.