logo móvil
Contáctanos

Algoritmo híbrido de alto rendimiento para la agrupación mínima de suma de cuadrados de datos infinitamente altos

Autores: Mussabayev, Ravil; Mussabayev, Rustam

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Algoritmo híbrido de alto rendimiento para la agrupación mínima de suma de cuadrados de datos infinitamente altos


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Nueva formulación
Problema de agrupamiento
HPClust
Enfoques paralelos
Escalabilidad
Eficiencia computacional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
Este documento presenta una nueva formulación del problema de agrupación, a saber, la agrupación de suma mínima de cuadrados de datos infinitamente altos (MSSC-ITD), y presenta HPClust, un innovador conjunto de enfoques paralelos híbridos para su solución efectiva. Al utilizar técnicas modernas de computación de alto rendimiento, HPClust mejora métricas clave de agrupación: efectividad, eficiencia computacional y escalabilidad. Al contrario del paralelismo de datos básico, que solo acelera el tiempo de procesamiento a través del marco de MapReduce, nuestro enfoque desbloquea un rendimiento superior al aprovechar el paralelismo competitivo-cooperativo multiestratégico y las propiedades intrincadas del paisaje de la función objetivo. A diferencia de otros algoritmos disponibles que luchan por escalar, nuestro algoritmo es inherentemente paralelo en su naturaleza, mejorando la calidad de la solución a través de una mayor escalabilidad y paralelismo y superando incluso algoritmos avanzados diseñados para conjuntos de datos pequeños y medianos. Nuestra evaluación de HPClust, que presenta cuatro estrategias paralelas, demuestra su superioridad sobre métodos tradicionales y de vanguardia al ofrecer un mejor rendimiento en las métricas clave. Estos resultados también muestran que el procesamiento paralelo no solo mejora la eficiencia de agrupación, sino también la precisión. Además, exploramos el equilibrio entre eficiencia computacional y calidad de agrupación, proporcionando ideas sobre estrategias paralelas óptimas basadas en las especificidades del conjunto de datos y la disponibilidad de recursos. Esta investigación avanza en nuestra comprensión del paralelismo en algoritmos de agrupación, demostrando que una hibridación juiciosa de enfoques paralelos avanzados produce resultados óptimos para MSSC-ITD. Los experimentos en los datos sintéticos confirman aún más la escalabilidad excepcional de HPClust y su robustez al ruido.

Otros recursos que podrían interesarte

Temas Virtualpro