Un algoritmo de agrupamiento mejorado para datos de múltiple densidad
Autores: Almazroi, Abdulwahab Ali; Atwa, Walid
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un algoritmo de agrupamiento mejorado para datos de múltiple densidad
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Método de agrupamiento
Conjunto de datos
Algoritmo DBSCAN
Técnicas de agrupamiento basadas en densidad
Algoritmo semisupervisado
Datos de múltiple densidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
El método de agrupamiento divide un conjunto de datos en grupos con datos similares utilizando métricas de similitud. Sin embargo, descubrir grupos en diferentes densidades, formas y tamaños distintos sigue siendo una tarea desafiante. En este sentido, los expertos e investigadores optan por utilizar el algoritmo DBSCAN, ya que utiliza técnicas de agrupamiento basadas en la densidad que definen grupos de diferentes tamaños y formas. Sin embargo, se aplica erróneamente a grupos de diferentes densidades debido a sus atributos globales que generan una sola densidad. Además, la mayoría de los algoritmos existentes son métodos no supervisados, donde el conocimiento previo disponible es inútil. Para abordar estos problemas, esta investigación sugiere el uso de un algoritmo de agrupamiento que sea semisupervisado. Esto permite que el algoritmo utilice el conocimiento existente para generar restricciones por pares para agrupar datos de múltiples densidades. El algoritmo propuesto consta de dos etapas: primero, divide el conjunto de datos en diferentes conjuntos según su nivel de densidad y luego aplica el algoritmo DBSCAN semisupervisado a cada partición. La evaluación de los resultados muestra que el algoritmo funciona de manera efectiva y eficiente en comparación con los algoritmos de agrupamiento no supervisados.
Descripción
El método de agrupamiento divide un conjunto de datos en grupos con datos similares utilizando métricas de similitud. Sin embargo, descubrir grupos en diferentes densidades, formas y tamaños distintos sigue siendo una tarea desafiante. En este sentido, los expertos e investigadores optan por utilizar el algoritmo DBSCAN, ya que utiliza técnicas de agrupamiento basadas en la densidad que definen grupos de diferentes tamaños y formas. Sin embargo, se aplica erróneamente a grupos de diferentes densidades debido a sus atributos globales que generan una sola densidad. Además, la mayoría de los algoritmos existentes son métodos no supervisados, donde el conocimiento previo disponible es inútil. Para abordar estos problemas, esta investigación sugiere el uso de un algoritmo de agrupamiento que sea semisupervisado. Esto permite que el algoritmo utilice el conocimiento existente para generar restricciones por pares para agrupar datos de múltiples densidades. El algoritmo propuesto consta de dos etapas: primero, divide el conjunto de datos en diferentes conjuntos según su nivel de densidad y luego aplica el algoritmo DBSCAN semisupervisado a cada partición. La evaluación de los resultados muestra que el algoritmo funciona de manera efectiva y eficiente en comparación con los algoritmos de agrupamiento no supervisados.