Un algoritmo óptimo y estable para agrupar datos numéricos
Autores: Seman, Ali; Mohd Sapawi, Azizian
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un algoritmo óptimo y estable para agrupar datos numéricos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Convencional
K-medias
Siembra
Algoritmo de agrupamiento
Estabilidad
Optimalidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
En el marco convencional de k-medias, la siembra es el primer paso hacia la optimización antes de que los objetos sean agrupados. En la siembra aleatoria, surgen dos problemas principales: los resultados de agrupamiento pueden ser menos óptimos y se pueden obtener diferentes resultados de agrupamiento en cada ejecución. En aplicaciones del mundo real, es altamente deseable un agrupamiento óptimo y estable. Este informe presenta un nuevo algoritmo de agrupamiento llamado algoritmo de haplotipo modal aproximado de cero k (Zk-AMH) que utiliza un mecanismo de siembra simple y novedoso conocido como espacios multidimensionales de punto cero. El Zk-AMH proporciona la optimalidad y estabilidad del agrupamiento, resolviendo así los problemas mencionados anteriormente. Notablemente, el algoritmo Zk-AMH arrojó puntuaciones medias idénticas a las máximas y mínimas en 100 ejecuciones, produciendo una desviación estándar cero para mostrar su estabilidad. Además, cuando se aplicó el algoritmo Zk-AMH a ocho conjuntos de datos, logró las puntuaciones medias más altas para cuatro conjuntos de datos, produjo una puntuación aproximadamente igual para un conjunto de datos y arrojó puntuaciones ligeramente más bajas para los otros tres conjuntos de datos. Con su optimalidad y estabilidad, el algoritmo Zk-AMH podría ser una alternativa adecuada para desarrollar herramientas de agrupamiento futuras.
Descripción
En el marco convencional de k-medias, la siembra es el primer paso hacia la optimización antes de que los objetos sean agrupados. En la siembra aleatoria, surgen dos problemas principales: los resultados de agrupamiento pueden ser menos óptimos y se pueden obtener diferentes resultados de agrupamiento en cada ejecución. En aplicaciones del mundo real, es altamente deseable un agrupamiento óptimo y estable. Este informe presenta un nuevo algoritmo de agrupamiento llamado algoritmo de haplotipo modal aproximado de cero k (Zk-AMH) que utiliza un mecanismo de siembra simple y novedoso conocido como espacios multidimensionales de punto cero. El Zk-AMH proporciona la optimalidad y estabilidad del agrupamiento, resolviendo así los problemas mencionados anteriormente. Notablemente, el algoritmo Zk-AMH arrojó puntuaciones medias idénticas a las máximas y mínimas en 100 ejecuciones, produciendo una desviación estándar cero para mostrar su estabilidad. Además, cuando se aplicó el algoritmo Zk-AMH a ocho conjuntos de datos, logró las puntuaciones medias más altas para cuatro conjuntos de datos, produjo una puntuación aproximadamente igual para un conjunto de datos y arrojó puntuaciones ligeramente más bajas para los otros tres conjuntos de datos. Con su optimalidad y estabilidad, el algoritmo Zk-AMH podría ser una alternativa adecuada para desarrollar herramientas de agrupamiento futuras.