logo móvil
Contáctanos

Clustering de Densidad de Componentes Rápidos en Bases de Datos Espaciales: Un Algoritmo Novel

Autores: Bataineh, Bilal

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Clustering de Densidad de Componentes Rápidos en Bases de Datos Espaciales: Un Algoritmo Novel


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Análisis de agrupamiento
Algoritmos de agrupamiento
Técnica de agrupamiento basada en densidad
Bases de datos espaciales
Desafíos
FCDCSD

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El análisis de agrupamiento es una técnica significativa en varios campos, incluyendo el aprendizaje automático no supervisado, la minería de datos, el reconocimiento de patrones y el análisis de imágenes. Actualmente se utilizan muchos algoritmos de agrupamiento, pero casi todos ellos enfrentan diversos desafíos, como baja precisión, número requerido de clústeres, procesamiento lento, incapacidad para producir clústeres de forma no esférica y rendimiento inestable con respecto a las características y el tamaño de los datos. En esta investigación, se propone un nuevo algoritmo de agrupamiento llamado agrupamiento de densidad de componentes rápido en bases de datos espaciales (FCDCSD) utilizando una técnica de agrupamiento basada en densidad para abordar los desafíos existentes mencionados. Primero, desde el punto más pequeño hasta el más grande en el campo espacial, cada punto se etiqueta con un valor temporal, y los valores adyacentes en un componente se almacenan en un conjunto. Luego, todos los conjuntos con valores compartidos se fusionan y se resuelven para obtener un único valor que es representativo de los conjuntos fusionados. Estos valores representan los valores finales de los clústeres; es decir, los equivalentes temporales en el conjunto de datos se reemplazan para generar los clústeres finales. Si aparece algo de ruido, se realiza un post-proceso y se asignan valores al clúster más cercano según un conjunto de reglas. Se utilizaron varios conjuntos de datos sintéticos en los experimentos para evaluar la eficiencia del método propuesto. Los resultados indican que FCDCSD es generalmente superior a la propagación de afinidad, el agrupamiento jerárquico aglomerativo, k-means, mean-shift, espectral y el agrupamiento espacial basado en densidad de aplicaciones con ruido, ordenando puntos para identificar estructuras de agrupamiento y métodos de agrupamiento de mezcla gaussiana.

Otros recursos que podrían interesarte

Temas Virtualpro