Evaluando métodos para evaluar el número de componentes en la factorización de matrices no negativas
Autores: Maisog, José M.; DeMarco, Andrew T.; Devarajan, Karthik; Young, Stanley; Fogel, Paul; Luta, George
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Evaluando métodos para evaluar el número de componentes en la factorización de matrices no negativas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
No negativo
Factorización de matrices
Componentes
Métodos de estimación
Normalización
Componentes ortogonales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
La factorización de matrices no negativas es un método relativamente nuevo de descomposición de matrices que descompone una matriz de datos x en una matriz x y una matriz x , de modo que ~ x . Es importante destacar que todos los valores en , , y están restringidos a ser no negativos. La NMF se puede utilizar para la reducción de dimensionalidad, ya que las columnas de se pueden considerar componentes en los que se ha descompuesto . Surge la pregunta: ¿cómo se elige ? En este documento, primero evaluamos métodos para estimar en el contexto de la NMF en datos sintéticos. En segundo lugar, examinamos el efecto de la normalización en la precisión de esta estimación en datos empíricos. En datos sintéticos con componentes subyacentes ortogonales, los métodos basados en PCA y el Coeficiente de Correlación Cofenética de Brunet lograron la mayor precisión. Cuando se evaluaron en un conjunto de datos reales conocido, la normalización tuvo un efecto impredecible en la estimación. Para cualquier método de normalización dado, los métodos para estimar dieron resultados muy variables. Concluimos que al estimar , es mejor no aplicar normalización. Si se sabe que los componentes subyacentes son ortogonales, entonces el MAP de Velicer o el método Laplace-PCA de Minka podrían ser los mejores. Sin embargo, cuando la ortogonalidad de los componentes subyacentes es desconocida, ninguno de los métodos parecía preferible.
Descripción
La factorización de matrices no negativas es un método relativamente nuevo de descomposición de matrices que descompone una matriz de datos x en una matriz x y una matriz x , de modo que ~ x . Es importante destacar que todos los valores en , , y están restringidos a ser no negativos. La NMF se puede utilizar para la reducción de dimensionalidad, ya que las columnas de se pueden considerar componentes en los que se ha descompuesto . Surge la pregunta: ¿cómo se elige ? En este documento, primero evaluamos métodos para estimar en el contexto de la NMF en datos sintéticos. En segundo lugar, examinamos el efecto de la normalización en la precisión de esta estimación en datos empíricos. En datos sintéticos con componentes subyacentes ortogonales, los métodos basados en PCA y el Coeficiente de Correlación Cofenética de Brunet lograron la mayor precisión. Cuando se evaluaron en un conjunto de datos reales conocido, la normalización tuvo un efecto impredecible en la estimación. Para cualquier método de normalización dado, los métodos para estimar dieron resultados muy variables. Concluimos que al estimar , es mejor no aplicar normalización. Si se sabe que los componentes subyacentes son ortogonales, entonces el MAP de Velicer o el método Laplace-PCA de Minka podrían ser los mejores. Sin embargo, cuando la ortogonalidad de los componentes subyacentes es desconocida, ninguno de los métodos parecía preferible.