Investigación sobre el método de construcción de hipergrafo de sistemas de información basado en la medición de la distancia de pares de conjuntos
Autores: Wang, Jing; Lan, Siwu; Li, Xiangyu; Lu, Meng; Guo, Jingfeng; Zhang, Chunying; Liu, Bin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Investigación sobre el método de construcción de hipergrafo de sistemas de información basado en la medición de la distancia de pares de conjuntos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Gráfico especial
Datos estructurados
Hipercubo
Datos de alta dimensión
Medición de distancias
Construcción de hipercubos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Como un tipo especial de grafo de datos estructurados, un hipercubo puede describir de manera intuitiva no solo la relación de orden superior y el modo de conexión complejo entre nodos, sino también la relación implícita entre nodos. Con el objetivo de superar la limitación de la medición de distancia tradicional en datos de alta dimensión, en este documento se propone un nuevo método de construcción de hipercubos basado en la teoría de pares de conjuntos. Mediante la división de la relación entre atributos de datos, se calcula el grado de conexión de pares de conjuntos entre muestras, y se obtiene la distancia de pares de conjuntos entre muestras. Luego, sobre la base de la distancia de pares de conjuntos, se utiliza la técnica de combinación de vecinos más cercanos y radio para construir un hipercubo, y se demuestran experimentalmente la expresión de alta dimensión y el agrupamiento de hipercubos. Al realizar experimentos en diferentes conjuntos de datos en la plataforma de conjunto de datos de código abierto de Kaggle, se muestra la comparación de la pureza del grupo, el coeficiente de Rand y la información mutua normalizada para demostrar que este método de medición de distancia es más efectivo en la expresión de alta dimensión y muestra una mejora de rendimiento más significativa en el agrupamiento espectral.
Descripción
Como un tipo especial de grafo de datos estructurados, un hipercubo puede describir de manera intuitiva no solo la relación de orden superior y el modo de conexión complejo entre nodos, sino también la relación implícita entre nodos. Con el objetivo de superar la limitación de la medición de distancia tradicional en datos de alta dimensión, en este documento se propone un nuevo método de construcción de hipercubos basado en la teoría de pares de conjuntos. Mediante la división de la relación entre atributos de datos, se calcula el grado de conexión de pares de conjuntos entre muestras, y se obtiene la distancia de pares de conjuntos entre muestras. Luego, sobre la base de la distancia de pares de conjuntos, se utiliza la técnica de combinación de vecinos más cercanos y radio para construir un hipercubo, y se demuestran experimentalmente la expresión de alta dimensión y el agrupamiento de hipercubos. Al realizar experimentos en diferentes conjuntos de datos en la plataforma de conjunto de datos de código abierto de Kaggle, se muestra la comparación de la pureza del grupo, el coeficiente de Rand y la información mutua normalizada para demostrar que este método de medición de distancia es más efectivo en la expresión de alta dimensión y muestra una mejora de rendimiento más significativa en el agrupamiento espectral.