Agrupación de núcleo basada en Ising
Autores: Kumagai, Masahito; Komatsu, Kazuhiko; Sato, Masayuki; Kobayashi, Hiroaki
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Agrupación de núcleo basada en Ising
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Modelo Ising
Método de agrupamiento
Agrupamiento de núcleos
Datos irregulares
Matriz de distancias
Espacio de alta dimensión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El método de agrupamiento combinatorio basado en el modelo de Ising está atrayendo la atención como un método de agrupamiento de alta calidad. Sin embargo, los métodos de agrupamiento basados en Ising convencionales que utilizan la distancia euclidiana no pueden manejar datos irregulares. Para superar este problema, este artículo propone un método de agrupamiento basado en kernel de Ising. El método de agrupamiento basado en kernel está diseñado sobre dos ideas críticas. Una es realizar el agrupamiento de datos irregulares mapeando los datos en un espacio de características de alta dimensión mediante un truco de kernel. La otra es la utilización de cálculos de matriz-matriz en las bibliotecas numéricas para acelerar el preprocesamiento para el recocido. Mientras que el agrupamiento basado en Ising convencional no está diseñado para aceptar los datos transformados por el truco de kernel, este artículo extiende la disponibilidad del agrupamiento basado en Ising para procesar una matriz de distancia definida en un espacio de datos de alta dimensión. El método propuesto puede manejar la matriz de Gram determinada por el método de kernel como una matriz de distancia de alta dimensión para manejar datos irregulares. Al comparar el método de agrupamiento de kernel basado en Ising propuesto con el agrupamiento combinatorio convencional basado en la distancia euclidiana, se aclara que la calidad de los resultados de agrupamiento del método propuesto para datos irregulares es significativamente mejor que la del método convencional. Además, el preprocesamiento para el recocido mediante el método propuesto utilizando bibliotecas numéricas es hasta un factor de hasta un millón veces mayor que la implementación ingenua de Python convencional. Las comparaciones entre el agrupamiento de kernel basado en Ising y el kernel K-means revelan que el método propuesto tiene el potencial de obtener resultados de agrupamiento de mayor calidad que el kernel K-means como representante de los métodos de agrupamiento de kernel de vanguardia.
Descripción
El método de agrupamiento combinatorio basado en el modelo de Ising está atrayendo la atención como un método de agrupamiento de alta calidad. Sin embargo, los métodos de agrupamiento basados en Ising convencionales que utilizan la distancia euclidiana no pueden manejar datos irregulares. Para superar este problema, este artículo propone un método de agrupamiento basado en kernel de Ising. El método de agrupamiento basado en kernel está diseñado sobre dos ideas críticas. Una es realizar el agrupamiento de datos irregulares mapeando los datos en un espacio de características de alta dimensión mediante un truco de kernel. La otra es la utilización de cálculos de matriz-matriz en las bibliotecas numéricas para acelerar el preprocesamiento para el recocido. Mientras que el agrupamiento basado en Ising convencional no está diseñado para aceptar los datos transformados por el truco de kernel, este artículo extiende la disponibilidad del agrupamiento basado en Ising para procesar una matriz de distancia definida en un espacio de datos de alta dimensión. El método propuesto puede manejar la matriz de Gram determinada por el método de kernel como una matriz de distancia de alta dimensión para manejar datos irregulares. Al comparar el método de agrupamiento de kernel basado en Ising propuesto con el agrupamiento combinatorio convencional basado en la distancia euclidiana, se aclara que la calidad de los resultados de agrupamiento del método propuesto para datos irregulares es significativamente mejor que la del método convencional. Además, el preprocesamiento para el recocido mediante el método propuesto utilizando bibliotecas numéricas es hasta un factor de hasta un millón veces mayor que la implementación ingenua de Python convencional. Las comparaciones entre el agrupamiento de kernel basado en Ising y el kernel K-means revelan que el método propuesto tiene el potencial de obtener resultados de agrupamiento de mayor calidad que el kernel K-means como representante de los métodos de agrupamiento de kernel de vanguardia.