Simultaneous Bayesian clustering and model selection with mixture of robust factor analyzers
Autores: Feng, Shan; Xie, Wenxian; Nie, Yufeng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Simultaneous Bayesian clustering and model selection with mixture of robust factor analyzers
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos de mezcla gaussiana
Tareas de agrupamiento
Modelo gráfico generativo
Aprendizaje no supervisado robusto
Analizadores de factores
Inferencia bayesiana variacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Los modelos finitos de mezcla gaussiana son herramientas poderosas para modelar distribuciones de fenómenos aleatorios y son ampliamente utilizados para tareas de agrupamiento. Sin embargo, su interpretabilidad y eficiencia a menudo se ven degradadas por el impacto de la redundancia y el ruido, especialmente en conjuntos de datos de alta dimensionalidad. En este trabajo, proponemos un modelo gráfico generativo para modelar de manera parsimoniosa las mezclas gaussianas y un aprendizaje no supervisado robusto. El modelo asume que los datos son generados de forma independiente e idéntica a partir de una mezcla finita de analizadores de factores robustos, donde la relevancia de las características se ajusta mediante un conjunto activo de factores latentes para permitir una violación de la suposición de independencia local. Para la inferencia del modelo, proponemos un marco de inferencia de Bayes variacional estructurado para realizar simultáneamente el agrupamiento, la selección del modelo y el procesamiento de valores atípicos. El rendimiento del algoritmo propuesto se evalúa realizando experimentos en conjuntos de datos artificiales y del mundo real. Además, se introduce una aplicación en la tarea de aprendizaje automático de reconocimiento de alfabeto manuscrito de alta dimensionalidad.
Descripción
Los modelos finitos de mezcla gaussiana son herramientas poderosas para modelar distribuciones de fenómenos aleatorios y son ampliamente utilizados para tareas de agrupamiento. Sin embargo, su interpretabilidad y eficiencia a menudo se ven degradadas por el impacto de la redundancia y el ruido, especialmente en conjuntos de datos de alta dimensionalidad. En este trabajo, proponemos un modelo gráfico generativo para modelar de manera parsimoniosa las mezclas gaussianas y un aprendizaje no supervisado robusto. El modelo asume que los datos son generados de forma independiente e idéntica a partir de una mezcla finita de analizadores de factores robustos, donde la relevancia de las características se ajusta mediante un conjunto activo de factores latentes para permitir una violación de la suposición de independencia local. Para la inferencia del modelo, proponemos un marco de inferencia de Bayes variacional estructurado para realizar simultáneamente el agrupamiento, la selección del modelo y el procesamiento de valores atípicos. El rendimiento del algoritmo propuesto se evalúa realizando experimentos en conjuntos de datos artificiales y del mundo real. Además, se introduce una aplicación en la tarea de aprendizaje automático de reconocimiento de alfabeto manuscrito de alta dimensionalidad.