Análisis de componentes principales probabilísticos bilineares robustos
Autores: Lu, Yaohang; Teng, Zhongming
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Análisis de componentes principales probabilísticos bilineares robustos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Análisis de componentes principales
PPCA
BPPCA
Distribuciones gaussianas matriciales
Valores atípicos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 53
Citaciones: Sin citaciones
El análisis de componentes principales (PCA) es una de las herramientas más populares en el análisis exploratorio de datos multivariados. Su versión probabilística (PPCA), basada en el procedimiento de máxima verosimilitud, proporciona una manera probabilística de implementar la reducción de dimensiones. Recientemente, se ha introducido el modelo PPCA bilineal (BPPCA), que asume que los términos de ruido siguen distribuciones gaussianas de matriz variada, para tratar directamente con datos bidimensionales (2-D) y preservar la estructura de matriz de los datos 2-D, como imágenes, evitando la maldición de la dimensionalidad. Sin embargo, las distribuciones gaussianas no siempre están disponibles en aplicaciones de la vida real que pueden contener valores atípicos dentro de los conjuntos de datos. Con el fin de hacer que BPPCA sea robusto para valores atípicos, en este documento, proponemos un modelo robusto de BPPCA bajo la suposición de distribuciones de matriz variada para los términos de ruido. Se utiliza el algoritmo de expectativa condicional de maximización alternante (AECM) para estimar los parámetros del modelo. Se presentan ejemplos numéricos en varios conjuntos de datos sintéticos y disponibles públicamente para demostrar la superioridad de nuestro modelo propuesto en la extracción de características, clasificación y detección de valores atípicos.
Descripción
El análisis de componentes principales (PCA) es una de las herramientas más populares en el análisis exploratorio de datos multivariados. Su versión probabilística (PPCA), basada en el procedimiento de máxima verosimilitud, proporciona una manera probabilística de implementar la reducción de dimensiones. Recientemente, se ha introducido el modelo PPCA bilineal (BPPCA), que asume que los términos de ruido siguen distribuciones gaussianas de matriz variada, para tratar directamente con datos bidimensionales (2-D) y preservar la estructura de matriz de los datos 2-D, como imágenes, evitando la maldición de la dimensionalidad. Sin embargo, las distribuciones gaussianas no siempre están disponibles en aplicaciones de la vida real que pueden contener valores atípicos dentro de los conjuntos de datos. Con el fin de hacer que BPPCA sea robusto para valores atípicos, en este documento, proponemos un modelo robusto de BPPCA bajo la suposición de distribuciones de matriz variada para los términos de ruido. Se utiliza el algoritmo de expectativa condicional de maximización alternante (AECM) para estimar los parámetros del modelo. Se presentan ejemplos numéricos en varios conjuntos de datos sintéticos y disponibles públicamente para demostrar la superioridad de nuestro modelo propuesto en la extracción de características, clasificación y detección de valores atípicos.