Un enfoque robusto para identificar los principales componentes del Índice de Tolerancia a la Corrupción
Autores: Homocianu, Daniel; Plopeanu, Aurelian-Petru; Ianole-Calin, Rodica
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un enfoque robusto para identificar los principales componentes del Índice de Tolerancia a la Corrupción
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Técnicas estadísticas avanzadas
Técnicas de minería de datos
Mediciones de corrupción
Naive Bayes
Paquete LASSO
Regresiones logit
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
El documento tiene como objetivo enfatizar las ventajas de varias técnicas avanzadas de estadística y minería de datos cuando se aplican a la densa literatura sobre mediciones y determinantes de la corrupción. Para ello, utilizamos las siete olas de la Encuesta Mundial de Valores y empleamos la técnica de Naive Bayes en SQL Server Analysis Services 2016, el paquete LASSO junto con regresiones logit y melogit con coeficientes brutos en Stata 16. Además, realizamos diferentes tipos de pruebas y validaciones cruzadas en las categorías de ola, país, género y edad. Para eliminar la multicolinealidad, utilizamos matrices de correlación de predictores. Además, evaluamos el factor de inflación de la varianza (VIF) máximo calculado frente a un umbral máximo aceptable, dependiendo del coeficiente de determinación del modelo en regresiones de Mínimos Cuadrados Ordinarios (OLS). Nuestra principal contribución consiste en una metodología para explorar y validar los predictores más importantes del riesgo asociado con la tolerancia a los sobornos. Encontramos el papel significativo de tres influencias correspondientes a preguntas sobre actitudes hacia la propiedad, autoridad y servicios públicos, y otras personas en términos de anti-tramposos, anti-evasión y anti-violencia. Utilizamos regresiones scobit, probit y logit con efectos marginales promedio para construir y probar el índice basado en estas actitudes. Probamos con éxito el índice utilizando también nomogramas de predicción de riesgos y medidas de precisión (AUCROC > 0.9).
Descripción
El documento tiene como objetivo enfatizar las ventajas de varias técnicas avanzadas de estadística y minería de datos cuando se aplican a la densa literatura sobre mediciones y determinantes de la corrupción. Para ello, utilizamos las siete olas de la Encuesta Mundial de Valores y empleamos la técnica de Naive Bayes en SQL Server Analysis Services 2016, el paquete LASSO junto con regresiones logit y melogit con coeficientes brutos en Stata 16. Además, realizamos diferentes tipos de pruebas y validaciones cruzadas en las categorías de ola, país, género y edad. Para eliminar la multicolinealidad, utilizamos matrices de correlación de predictores. Además, evaluamos el factor de inflación de la varianza (VIF) máximo calculado frente a un umbral máximo aceptable, dependiendo del coeficiente de determinación del modelo en regresiones de Mínimos Cuadrados Ordinarios (OLS). Nuestra principal contribución consiste en una metodología para explorar y validar los predictores más importantes del riesgo asociado con la tolerancia a los sobornos. Encontramos el papel significativo de tres influencias correspondientes a preguntas sobre actitudes hacia la propiedad, autoridad y servicios públicos, y otras personas en términos de anti-tramposos, anti-evasión y anti-violencia. Utilizamos regresiones scobit, probit y logit con efectos marginales promedio para construir y probar el índice basado en estas actitudes. Probamos con éxito el índice utilizando también nomogramas de predicción de riesgos y medidas de precisión (AUCROC > 0.9).