mejorando la representatividad de una muestra aleatoria simple: un modelo de optimización y su aplicación a la muestra continua de vidas laborales
Autores: Núñez-Antón, Vicente; Pérez-Salamero González, Juan Manuel; Regúlez-Castillo, Marta; Vidal-Meliá, Carlos
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
mejorando la representatividad de una muestra aleatoria simple: un modelo de optimización y su aplicación a la muestra continua de vidas laborales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Propone
Modelo de optimización
Submuestra
Representatividad
Muestra aleatoria
Población
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Este documento propone un modelo de optimización para seleccionar una muestra más grande que mejora la representatividad de una muestra aleatoria simple obtenida previamente de una población mayor que la población de interés. La formulación del problema implica programación no lineal mixta entera convexa (convex MINLP) y, por lo tanto, es NP-duro. Sin embargo, la solución se encuentra maximizando el tamaño de la submuestra tomada de una muestra aleatoria estratificada con asignación proporcional y restringiéndola a un valor lo suficientemente grande para lograr un buen ajuste a la población de interés utilizando la prueba de bondad de ajuste chi-cuadrado de Pearson. El documento también aplica el modelo a la Muestra Continua de Carreras Laborales (CSWL), que es un conjunto de microdatos anonimizados que contienen información sobre individuos de los registros de la Seguridad Social española y los resultados demuestran que es posible obtener una muestra más grande de la CSWL que representa (mucho) mejor a la población de jubilados para cada una de las olas analizadas.
Descripción
Este documento propone un modelo de optimización para seleccionar una muestra más grande que mejora la representatividad de una muestra aleatoria simple obtenida previamente de una población mayor que la población de interés. La formulación del problema implica programación no lineal mixta entera convexa (convex MINLP) y, por lo tanto, es NP-duro. Sin embargo, la solución se encuentra maximizando el tamaño de la submuestra tomada de una muestra aleatoria estratificada con asignación proporcional y restringiéndola a un valor lo suficientemente grande para lograr un buen ajuste a la población de interés utilizando la prueba de bondad de ajuste chi-cuadrado de Pearson. El documento también aplica el modelo a la Muestra Continua de Carreras Laborales (CSWL), que es un conjunto de microdatos anonimizados que contienen información sobre individuos de los registros de la Seguridad Social española y los resultados demuestran que es posible obtener una muestra más grande de la CSWL que representa (mucho) mejor a la población de jubilados para cada una de las olas analizadas.