Validación de agrupamiento inferencial
Autores: Figuera, Pau; Cuzzocrea, Alfredo; García Bringas, Pablo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Validación de agrupamiento inferencial
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Validación de agrupamiento
Aprendizaje automático no supervisado
Factorización de matrices no negativas
Divergencia de Kullback-Leibler
Método de validación interna
Modelo de validación de agrupamiento predictivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La validación del agrupamiento se aplica para evaluar la calidad de las clasificaciones. Este paso es crucial para el aprendizaje automático no supervisado. Existen una gran cantidad de métodos para este propósito; sin embargo, una desventaja común es que no es posible la inferencia estadística. En este estudio, construimos una función de densidad para el número de clusters. Para este propósito, utilizamos técnicas suaves. Luego, aplicamos la factorización de matrices no negativas utilizando la divergencia de Kullback-Leibler. Empleando una hipótesis única de variables observacionales linealmente independientes y no correlacionadas, construimos una secuencia variando la dimensión del espacio de rango de la factorización solo utilizando técnicas analíticas. La esperanza del límite de esta secuencia sigue una función de densidad de probabilidad gamma. Luego, identificando la dimensión de la factorización del espacio de rango con clusters, transformamos la estimación de la dimensión adecuada de la factorización en una estimación probabilística del número de clusters. Este enfoque es un método de validación interna que es adecuado para datos multivariados numéricos y categóricos e independiente de la técnica de agrupamiento. Nuestro logro principal es un modelo predictivo de validación de agrupamiento con capacidades gráficas. Proporciona resultados en términos de credibilidad, lo que hace posible comparar resultados como el juicio de expertos sobre una base cuantitativa.
Descripción
La validación del agrupamiento se aplica para evaluar la calidad de las clasificaciones. Este paso es crucial para el aprendizaje automático no supervisado. Existen una gran cantidad de métodos para este propósito; sin embargo, una desventaja común es que no es posible la inferencia estadística. En este estudio, construimos una función de densidad para el número de clusters. Para este propósito, utilizamos técnicas suaves. Luego, aplicamos la factorización de matrices no negativas utilizando la divergencia de Kullback-Leibler. Empleando una hipótesis única de variables observacionales linealmente independientes y no correlacionadas, construimos una secuencia variando la dimensión del espacio de rango de la factorización solo utilizando técnicas analíticas. La esperanza del límite de esta secuencia sigue una función de densidad de probabilidad gamma. Luego, identificando la dimensión de la factorización del espacio de rango con clusters, transformamos la estimación de la dimensión adecuada de la factorización en una estimación probabilística del número de clusters. Este enfoque es un método de validación interna que es adecuado para datos multivariados numéricos y categóricos e independiente de la técnica de agrupamiento. Nuestro logro principal es un modelo predictivo de validación de agrupamiento con capacidades gráficas. Proporciona resultados en términos de credibilidad, lo que hace posible comparar resultados como el juicio de expertos sobre una base cuantitativa.