Optimizando la estimación de un ancho de bin de histograma: aplicación a la estimación del modelo de mezcla multivariante
Autores: Pani, Branislav; Klemenc, Jernej; Nagode, Marko
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Optimizando la estimación de un ancho de bin de histograma: aplicación a la estimación del modelo de mezcla multivariante
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelo de mezcla multivariante de máxima verosimilitud
REBMIX
Algoritmos EM
Estimación de histograma
Modelo de mezcla gaussiano
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Una estimación de máxima verosimilitud de los parámetros de un modelo de mezcla multivariante es un problema difícil. Un enfoque es combinar los algoritmos REBMIX y EM. Sin embargo, el algoritmo REBMIX requiere el uso de una estimación de histograma, que es el enfoque más rudimentario para una estimación de densidad empírica y tiene muchas desventajas. Sin embargo, debido a su simplicidad, sigue siendo una de las técnicas más comúnmente utilizadas. El principal problema es estimar el ancho óptimo del bin del histograma, que generalmente se establece por el número de bins no superpuestos y regularmente espaciados. Para problemas univariados, generalmente se denota por un valor entero; es decir, el número de bins. Sin embargo, para problemas multivariados, para obtener una estimación de histograma, se debe formar una rejilla regular. Por lo tanto, para obtener la estimación óptima del histograma, se debe resolver un problema de optimización entera. El objetivo es, por lo tanto, la estimación de la partición óptima del histograma, solo y en aplicación a la estimación de parámetros del modelo de mezcla con la estrategia REBMIX&EM. Como estimador, se utilizó la regla de Knuth. Para el algoritmo de optimización, se compuso una derivada basada en la optimización de descenso de coordenadas. Estas propuestas arrojaron resultados prometedores. El algoritmo de optimización fue eficiente y los resultados fueron precisos. Cuando se aplicaron a la estimación de parámetros del modelo de mezcla gaussiana multivariante, los resultados fueron competitivos. Todas las mejoras se implementaron en el paquete R.
Descripción
Una estimación de máxima verosimilitud de los parámetros de un modelo de mezcla multivariante es un problema difícil. Un enfoque es combinar los algoritmos REBMIX y EM. Sin embargo, el algoritmo REBMIX requiere el uso de una estimación de histograma, que es el enfoque más rudimentario para una estimación de densidad empírica y tiene muchas desventajas. Sin embargo, debido a su simplicidad, sigue siendo una de las técnicas más comúnmente utilizadas. El principal problema es estimar el ancho óptimo del bin del histograma, que generalmente se establece por el número de bins no superpuestos y regularmente espaciados. Para problemas univariados, generalmente se denota por un valor entero; es decir, el número de bins. Sin embargo, para problemas multivariados, para obtener una estimación de histograma, se debe formar una rejilla regular. Por lo tanto, para obtener la estimación óptima del histograma, se debe resolver un problema de optimización entera. El objetivo es, por lo tanto, la estimación de la partición óptima del histograma, solo y en aplicación a la estimación de parámetros del modelo de mezcla con la estrategia REBMIX&EM. Como estimador, se utilizó la regla de Knuth. Para el algoritmo de optimización, se compuso una derivada basada en la optimización de descenso de coordenadas. Estas propuestas arrojaron resultados prometedores. El algoritmo de optimización fue eficiente y los resultados fueron precisos. Cuando se aplicaron a la estimación de parámetros del modelo de mezcla gaussiana multivariante, los resultados fueron competitivos. Todas las mejoras se implementaron en el paquete R.