Enfoque de Agrupamiento Jerárquico para Seleccionar Siluetas Representativas
Autores: Battulga, Lkhagvadorj; Nasridinov, Aziz
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Enfoque de Agrupamiento Jerárquico para Seleccionar Siluetas Representativas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Consulta
Horizonte
Puntos de datos
Dimensionalidad
Puntos representativos del horizonte
Método
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Recientemente, la consulta de horizonte ha atraído interés en una amplia gama de aplicaciones, desde sistemas de recomendación hasta redes informáticas. La consulta de horizonte es útil para obtener los puntos de datos dominantes del conjunto de datos dado. En un conjunto de datos de baja dimensión, la consulta de horizonte puede devolver un pequeño número de puntos de horizonte. Sin embargo, a medida que aumenta la dimensionalidad del conjunto de datos, también aumenta el número de puntos de horizonte. En otras palabras, dependiendo de la distribución de los datos y la dimensionalidad, la mayoría de los puntos de datos pueden convertirse en puntos de horizonte. Con la aparición de aplicaciones de big data, donde la distribución de datos y la dimensionalidad son un problema significativo, es necesario obtener puntos de horizonte representativos entre los puntos de horizonte resultantes. Ha habido varios métodos que se han centrado en extraer puntos de horizonte representativos con diversos grados de éxito. Sin embargo, los métodos existentes tienen un problema de re-cálculo cuando el umbral global cambia. Además, en ciertos casos, los puntos de horizonte representativos resultantes pueden no satisfacer a un usuario con múltiples preferencias. Así, en este artículo, proponemos un nuevo método de procesamiento de consultas de horizonte representativo, llamado clúster de horizonte representativo (RSC), que resuelve los problemas de los métodos existentes. Nuestro método utiliza el método de agrupamiento jerárquico aglomerativo para encontrar los puntos de horizonte representativos exactos, lo que nos permite reducir significativamente el tiempo de re-cálculo. Mostramos la superioridad de nuestro método propuesto sobre los métodos existentes de última generación con varios tipos de experimentos.
Descripción
Recientemente, la consulta de horizonte ha atraído interés en una amplia gama de aplicaciones, desde sistemas de recomendación hasta redes informáticas. La consulta de horizonte es útil para obtener los puntos de datos dominantes del conjunto de datos dado. En un conjunto de datos de baja dimensión, la consulta de horizonte puede devolver un pequeño número de puntos de horizonte. Sin embargo, a medida que aumenta la dimensionalidad del conjunto de datos, también aumenta el número de puntos de horizonte. En otras palabras, dependiendo de la distribución de los datos y la dimensionalidad, la mayoría de los puntos de datos pueden convertirse en puntos de horizonte. Con la aparición de aplicaciones de big data, donde la distribución de datos y la dimensionalidad son un problema significativo, es necesario obtener puntos de horizonte representativos entre los puntos de horizonte resultantes. Ha habido varios métodos que se han centrado en extraer puntos de horizonte representativos con diversos grados de éxito. Sin embargo, los métodos existentes tienen un problema de re-cálculo cuando el umbral global cambia. Además, en ciertos casos, los puntos de horizonte representativos resultantes pueden no satisfacer a un usuario con múltiples preferencias. Así, en este artículo, proponemos un nuevo método de procesamiento de consultas de horizonte representativo, llamado clúster de horizonte representativo (RSC), que resuelve los problemas de los métodos existentes. Nuestro método utiliza el método de agrupamiento jerárquico aglomerativo para encontrar los puntos de horizonte representativos exactos, lo que nos permite reducir significativamente el tiempo de re-cálculo. Mostramos la superioridad de nuestro método propuesto sobre los métodos existentes de última generación con varios tipos de experimentos.