logo móvil
Contáctanos

Agrupación de subespacios de múltiples particiones

Autores: Vandewalle, Vincent

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Agrupación de subespacios de múltiples particiones


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Agrupamiento basado en modelos
Variables latentes
Heterogeneidad
Datos
Subespacios
Criterio BIC

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
En el agrupamiento basado en modelos, a menudo se supone que solo una variable latente de agrupamiento explica la heterogeneidad de todo el conjunto de datos. Sin embargo, en muchos casos varias variables latentes podrían explicar la heterogeneidad de los datos en cuestión. En el entorno de datos continuos, se propone un modelo de agrupamiento basado en múltiples particiones. Supone la existencia de varias variables latentes de agrupamiento, cada una explicando la heterogeneidad de los datos con respecto a algún subespacio de agrupamiento. Esto permite encontrar simultáneamente las múltiples particiones y los subespacios relacionados. Los parámetros del modelo se estiman a través de un algoritmo EM que se basa en una reinterpretación probabilística del análisis discriminante factorial. Se propone una estrategia de elección de modelo basada en el criterio BIC para seleccionar el número de subespacios y el número de agrupaciones por subespacio. Los resultados obtenidos son varias proyecciones de los datos, cada una transmitiendo su propio agrupamiento de los datos. El comportamiento del modelo se ilustra en datos simulados y reales.

Otros recursos que podrían interesarte

Temas Virtualpro