En la selección de rango en la factorización matricial no negativa utilizando la concordancia
Autores: Fogel, Paul; Geissler, Christophe; Morizet, Nicolas; Luta, George
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
En la selección de rango en la factorización matricial no negativa utilizando la concordancia
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Rango de factorización
Matriz
No negativo
Agrupamiento
NMF
Criterio
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La elección de la clasificación de rango de una matriz es crítica, por ejemplo, en la reducción de dimensionalidad, filtrado, agrupamiento, deconvolución, etc., porque seleccionar un rango que sea demasiado alto equivale a ajustar el ruido, mientras que seleccionar un rango que sea demasiado bajo resulta en la simplificación excesiva de la señal. Se han propuesto numerosos métodos para seleccionar el rango de clasificación de una matriz no negativa. Uno de ellos es el coeficiente de correlación cofenética (), ampliamente utilizado en ciencia de datos para evaluar el número de agrupaciones en un agrupamiento jerárquico. En trabajos anteriores, se demostró que es mejor que otros métodos para la selección de rango en la factorización de matriz no negativa (NMF) cuando la estructura subyacente de la matriz consiste en agrupaciones ortogonales. En este artículo, mostramos que usar la relación de con el error de aproximación mejora significativamente la precisión de la selección de rango. También proponemos un nuevo criterio, , que, al igual que , se beneficia de la naturaleza estocástica de NMF; su precisión también se mejora al usar su forma de relación con el error. Utilizando datos reales y simulados, mostramos que , con un algoritmo de detección automática basado en CUSUM para sus formas originales o de relación con el error, supera significativamente a . Es importante tener en cuenta que el nuevo criterio funciona para una clase más amplia de matrices, donde no se asume que las agrupaciones subyacentes son ortogonales.
Descripción
La elección de la clasificación de rango de una matriz es crítica, por ejemplo, en la reducción de dimensionalidad, filtrado, agrupamiento, deconvolución, etc., porque seleccionar un rango que sea demasiado alto equivale a ajustar el ruido, mientras que seleccionar un rango que sea demasiado bajo resulta en la simplificación excesiva de la señal. Se han propuesto numerosos métodos para seleccionar el rango de clasificación de una matriz no negativa. Uno de ellos es el coeficiente de correlación cofenética (), ampliamente utilizado en ciencia de datos para evaluar el número de agrupaciones en un agrupamiento jerárquico. En trabajos anteriores, se demostró que es mejor que otros métodos para la selección de rango en la factorización de matriz no negativa (NMF) cuando la estructura subyacente de la matriz consiste en agrupaciones ortogonales. En este artículo, mostramos que usar la relación de con el error de aproximación mejora significativamente la precisión de la selección de rango. También proponemos un nuevo criterio, , que, al igual que , se beneficia de la naturaleza estocástica de NMF; su precisión también se mejora al usar su forma de relación con el error. Utilizando datos reales y simulados, mostramos que , con un algoritmo de detección automática basado en CUSUM para sus formas originales o de relación con el error, supera significativamente a . Es importante tener en cuenta que el nuevo criterio funciona para una clase más amplia de matrices, donde no se asume que las agrupaciones subyacentes son ortogonales.