Óptima submuestreo para regresión paramétrica de expectativa superior
Autores: Liu, Zhaolei
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Óptima submuestreo para regresión paramétrica de expectativa superior
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Análisis de regresión clásico
Término de error
Big data
Modelo de regresión de parámetro de expectativa superior
Heterogeneidad de distribución
Submuestreo de Poisson
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En el análisis de regresión clásico, el término de error del modelo suele cumplir con el requisito de ser independiente e idénticamente distribuido. Sin embargo, en el ámbito de los grandes datos, es sumamente común que el término de error presente distribuciones variables debido a discrepancias en el momento y fuentes de recolección de datos. En este artículo, ampliamos y refinamos el modelo de regresión de parámetro de expectativa superior, introduciendo una nueva forma de pérdida de expectativa superior, que maneja la heterogeneidad de distribución a través de grupos específicos, para garantizar una estimación de parámetros consistente y eficiente. Además, establecemos las propiedades asintóticas de esta estimación. Para abordar los desafíos planteados por los grandes datos o las restricciones de privacidad, proponemos un método que utiliza el submuestreo de Poisson para diseñar una nueva función de pérdida. Bajo ciertas suposiciones, este método satisface la condición de normalidad asintótica. Además, basándonos en las propiedades asintóticas, determinamos la probabilidad de muestreo óptima e introducimos la técnica de submuestreo óptima. Nuestro método de muestreo supera al muestreo uniforme, lo que reduce el ECM en aproximadamente en comparación con el muestreo uniforme, y es fácil de implementar en escenarios prácticos. Experimentos de simulación subsiguientes y ejemplos del mundo real demuestran aún más la efectividad de nuestro enfoque.
Descripción
En el análisis de regresión clásico, el término de error del modelo suele cumplir con el requisito de ser independiente e idénticamente distribuido. Sin embargo, en el ámbito de los grandes datos, es sumamente común que el término de error presente distribuciones variables debido a discrepancias en el momento y fuentes de recolección de datos. En este artículo, ampliamos y refinamos el modelo de regresión de parámetro de expectativa superior, introduciendo una nueva forma de pérdida de expectativa superior, que maneja la heterogeneidad de distribución a través de grupos específicos, para garantizar una estimación de parámetros consistente y eficiente. Además, establecemos las propiedades asintóticas de esta estimación. Para abordar los desafíos planteados por los grandes datos o las restricciones de privacidad, proponemos un método que utiliza el submuestreo de Poisson para diseñar una nueva función de pérdida. Bajo ciertas suposiciones, este método satisface la condición de normalidad asintótica. Además, basándonos en las propiedades asintóticas, determinamos la probabilidad de muestreo óptima e introducimos la técnica de submuestreo óptima. Nuestro método de muestreo supera al muestreo uniforme, lo que reduce el ECM en aproximadamente en comparación con el muestreo uniforme, y es fácil de implementar en escenarios prácticos. Experimentos de simulación subsiguientes y ejemplos del mundo real demuestran aún más la efectividad de nuestro enfoque.