Sobre el uso de métodos de aumento de gradiente para mejorar la estimación con datos obtenidos mediante procedimientos de auto-selección
Autores: Castro-Martín, Luis; Rueda, María del Mar; Ferri-García, Ramón; Hernando-Tamayo, César
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Sobre el uso de métodos de aumento de gradiente para mejorar la estimación con datos obtenidos mediante procedimientos de auto-selección
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Encuestas web
Cobertura
Sesgo de selección
Técnicas estadísticas
Algoritmo XGBoost
Muestras no probabilísticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
En los últimos años, las encuestas web se han establecido como uno de los principales métodos en la investigación empírica. Sin embargo, el efecto de la cobertura y el sesgo de selección en tales encuestas ha socavado su utilidad para la inferencia estadística en poblaciones finitas. Para compensar estos sesgos, los investigadores han empleado una variedad de técnicas estadísticas para ajustar muestras no probabilísticas de manera que se asemejen más a la población. En este estudio, probamos el potencial del algoritmo XGBoost en los métodos más importantes para la estimación que integran datos de una encuesta probabilística y una encuesta no probabilística. Al mismo tiempo, se hace una comparación de la efectividad de estos métodos para la eliminación de sesgos. Los resultados muestran que los cuatro estimadores propuestos basados en marcos de aumento de gradiente pueden mejorar la representatividad de la encuesta con respecto a otros métodos de predicción clásicos. La metodología propuesta también se utiliza para analizar una muestra real de encuesta no probabilística sobre los efectos sociales de la COVID-19.
Descripción
En los últimos años, las encuestas web se han establecido como uno de los principales métodos en la investigación empírica. Sin embargo, el efecto de la cobertura y el sesgo de selección en tales encuestas ha socavado su utilidad para la inferencia estadística en poblaciones finitas. Para compensar estos sesgos, los investigadores han empleado una variedad de técnicas estadísticas para ajustar muestras no probabilísticas de manera que se asemejen más a la población. En este estudio, probamos el potencial del algoritmo XGBoost en los métodos más importantes para la estimación que integran datos de una encuesta probabilística y una encuesta no probabilística. Al mismo tiempo, se hace una comparación de la efectividad de estos métodos para la eliminación de sesgos. Los resultados muestran que los cuatro estimadores propuestos basados en marcos de aumento de gradiente pueden mejorar la representatividad de la encuesta con respecto a otros métodos de predicción clásicos. La metodología propuesta también se utiliza para analizar una muestra real de encuesta no probabilística sobre los efectos sociales de la COVID-19.