Métodos de imputación única e intervalos de confianza para el índice de Gini
Autores: Álvarez-Verdejo, Encarnación; Moya-Fernández, Pablo J.; Muñoz-Rosas, Juan F.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Métodos de imputación única e intervalos de confianza para el índice de Gini
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos faltantes
Métodos de imputación única
índice de Gini
Intervalos de confianza
Sesgo de no respuesta
Imputación por regresión.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
El problema de datos faltantes es una característica común en cualquier estudio, y a menudo se aplica un método de imputación única para hacer frente a este problema. La primera contribución de este documento es analizar el rendimiento empírico de algunos métodos tradicionales de imputación única cuando se aplican a la estimación del índice de Gini, una medida popular de desigualdad utilizada en muchos estudios. También se evalúan empíricamente varios métodos para construir intervalos de confianza para el índice de Gini. Consideramos varias medidas empíricas para analizar el rendimiento de los estimadores e intervalos de confianza, lo que nos permite cuantificar la magnitud del problema de sesgo de no respuesta. Encontramos sesgos extremadamente grandes bajo ciertos mecanismos de no respuesta, y este problema empeora notablemente a medida que aumenta la proporción de datos faltantes. Para un coeficiente de correlación grande entre las variables objetivo y auxiliares, el método de imputación por regresión puede mitigar notablemente este problema de sesgo, produciendo errores cuadráticos medios adecuados. También encontramos que los intervalos de confianza tienen tasas de cobertura pobres cuando la probabilidad de que falten datos no es uniforme, y que el método de imputación por regresión mejora sustancialmente el manejo de este problema a medida que aumenta el coeficiente de correlación.
Descripción
El problema de datos faltantes es una característica común en cualquier estudio, y a menudo se aplica un método de imputación única para hacer frente a este problema. La primera contribución de este documento es analizar el rendimiento empírico de algunos métodos tradicionales de imputación única cuando se aplican a la estimación del índice de Gini, una medida popular de desigualdad utilizada en muchos estudios. También se evalúan empíricamente varios métodos para construir intervalos de confianza para el índice de Gini. Consideramos varias medidas empíricas para analizar el rendimiento de los estimadores e intervalos de confianza, lo que nos permite cuantificar la magnitud del problema de sesgo de no respuesta. Encontramos sesgos extremadamente grandes bajo ciertos mecanismos de no respuesta, y este problema empeora notablemente a medida que aumenta la proporción de datos faltantes. Para un coeficiente de correlación grande entre las variables objetivo y auxiliares, el método de imputación por regresión puede mitigar notablemente este problema de sesgo, produciendo errores cuadráticos medios adecuados. También encontramos que los intervalos de confianza tienen tasas de cobertura pobres cuando la probabilidad de que falten datos no es uniforme, y que el método de imputación por regresión mejora sustancialmente el manejo de este problema a medida que aumenta el coeficiente de correlación.