Estimación de densidad multivariada no paramétrica: estudio de caso del modelo de mezcla de Cauchy
Autores: Ruzgas, Tomas; Lukauskas, Mantas; epkauskas, Gedmantas
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Estimación de densidad multivariada no paramétrica: estudio de caso del modelo de mezcla de Cauchy
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estimación
Funciones de densidad de probabilidad
Valores atípicos
Modelo de mezcla de Cauchy
Estimación de densidad no paramétrica multivariada
Fórmula de inversión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La estimación de funciones de densidad de probabilidad (pdf) se considera una parte esencial del modelado estadístico. La heterocedasticidad y los valores atípicos son los problemas que dificultan el análisis de datos. El modelo de mezcla de Cauchy nos ayuda a abarcar ambos. Este documento estudia cinco tipos significativos diferentes de técnicas de estimación de densidad multivariante no paramétricas de manera algorítmica y empírica. Al mismo tiempo, no hacemos suposiciones sobre el origen de los datos de ninguna familia paramétrica conocida de distribución. El método de la fórmula de inversión se utiliza cuando el grupo de ruido está involucrado en el modelo de mezcla general. La efectividad del método se demuestra a través de un estudio de simulación. La relación entre la precisión de la evaluación y los modelos de mezcla de Cauchy multidimensionales complicados se analiza utilizando el método de Monte Carlo. Para dimensiones mayores (~ 5) y muestras pequeñas (~ 50), se recomienda el método del núcleo adaptativo. Si la muestra es ~ 100, se recomienda utilizar una fórmula de inversión modificada (MIDE). Es mejor para muestras más grandes con distribuciones superpuestas utilizar una estimación de núcleo semiparamétrica y métodos de inversión modificados para distribuciones más aisladas. Para el error porcentual absoluto medio, se recomienda utilizar una estimación de núcleo semiparamétrica cuando la muestra tiene distribuciones superpuestas. En dimensiones más pequeñas (= 2) y una muestra con distribuciones superpuestas, se recomienda utilizar el método de núcleo semiparamétrico (SKDE) y para distribuciones aisladas, se recomienda utilizar la fórmula de inversión modificada (MIDE). El algoritmo de la fórmula de inversión muestra que con el grupo de ruido, los resultados de la fórmula de inversión mejoraron significativamente.
Descripción
La estimación de funciones de densidad de probabilidad (pdf) se considera una parte esencial del modelado estadístico. La heterocedasticidad y los valores atípicos son los problemas que dificultan el análisis de datos. El modelo de mezcla de Cauchy nos ayuda a abarcar ambos. Este documento estudia cinco tipos significativos diferentes de técnicas de estimación de densidad multivariante no paramétricas de manera algorítmica y empírica. Al mismo tiempo, no hacemos suposiciones sobre el origen de los datos de ninguna familia paramétrica conocida de distribución. El método de la fórmula de inversión se utiliza cuando el grupo de ruido está involucrado en el modelo de mezcla general. La efectividad del método se demuestra a través de un estudio de simulación. La relación entre la precisión de la evaluación y los modelos de mezcla de Cauchy multidimensionales complicados se analiza utilizando el método de Monte Carlo. Para dimensiones mayores (~ 5) y muestras pequeñas (~ 50), se recomienda el método del núcleo adaptativo. Si la muestra es ~ 100, se recomienda utilizar una fórmula de inversión modificada (MIDE). Es mejor para muestras más grandes con distribuciones superpuestas utilizar una estimación de núcleo semiparamétrica y métodos de inversión modificados para distribuciones más aisladas. Para el error porcentual absoluto medio, se recomienda utilizar una estimación de núcleo semiparamétrica cuando la muestra tiene distribuciones superpuestas. En dimensiones más pequeñas (= 2) y una muestra con distribuciones superpuestas, se recomienda utilizar el método de núcleo semiparamétrico (SKDE) y para distribuciones aisladas, se recomienda utilizar la fórmula de inversión modificada (MIDE). El algoritmo de la fórmula de inversión muestra que con el grupo de ruido, los resultados de la fórmula de inversión mejoraron significativamente.