Gráficos de características: disposición de gráficos basada en árboles para análisis de características
Autores: Minghim, Rosane; Huancapaza, Liz; Artur, Erasmo; Telles, Guilherme P.; Belizario, Ivar V.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Gráficos de características: disposición de gráficos basada en árboles para análisis de características
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Análisis
Disposición de gráficos
Características
Basado en similitudes
Análisis de datos
Selección de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El análisis de características se ha convertido en una tarea muy crítica en el análisis y visualización de datos. Las estructuras de gráficos son muy flexibles en términos de representación y pueden codificar información importante sobre las características, pero son desafiantes en cuanto a la disposición adecuada para las tareas de análisis. En este estudio, proponemos y desarrollamos disposiciones de gráficos basadas en la similitud con el propósito de localizar patrones relevantes en conjuntos de características, apoyando así el análisis y selección de características. Aplicamos una disposición de árbol en el primer paso de la estrategia, para lograr la colocación de nodos y una visión general basada en la similitud de características. Al dibujar el resto de los bordes del gráfico según la demanda, se revelan más agrupaciones y relaciones entre las características. Evaluamos esos grupos y relaciones en términos de su efectividad en la exploración de conjuntos de características para el análisis de datos. La correlación de características con un atributo categórico objetivo y la clasificación de características se agregan para apoyar la tarea. Se emplean proyecciones multidimensionales para trazar el conjunto de datos basado en atributos seleccionados y revelar la efectividad del conjunto de características. Nuestros resultados han demostrado que el marco de disposición de gráficos de árbol permite una serie de observaciones que son muy importantes en la selección de características centrada en el usuario y que no son fáciles de observar mediante ninguna otra herramienta disponible. Proporcionan una forma de encontrar características relevantes e irrelevantes, conjuntos espurios de características ruidosas, grupos de características similares y características opuestas, todas las cuales son tareas esenciales en diferentes escenarios de análisis de datos. Estudios de caso en áreas de aplicación centradas en documentos, imágenes y datos de sonido demuestran la capacidad del marco para alcanzar rápidamente una representación compacta satisfactoria a partir de un conjunto de características más grande.
Descripción
El análisis de características se ha convertido en una tarea muy crítica en el análisis y visualización de datos. Las estructuras de gráficos son muy flexibles en términos de representación y pueden codificar información importante sobre las características, pero son desafiantes en cuanto a la disposición adecuada para las tareas de análisis. En este estudio, proponemos y desarrollamos disposiciones de gráficos basadas en la similitud con el propósito de localizar patrones relevantes en conjuntos de características, apoyando así el análisis y selección de características. Aplicamos una disposición de árbol en el primer paso de la estrategia, para lograr la colocación de nodos y una visión general basada en la similitud de características. Al dibujar el resto de los bordes del gráfico según la demanda, se revelan más agrupaciones y relaciones entre las características. Evaluamos esos grupos y relaciones en términos de su efectividad en la exploración de conjuntos de características para el análisis de datos. La correlación de características con un atributo categórico objetivo y la clasificación de características se agregan para apoyar la tarea. Se emplean proyecciones multidimensionales para trazar el conjunto de datos basado en atributos seleccionados y revelar la efectividad del conjunto de características. Nuestros resultados han demostrado que el marco de disposición de gráficos de árbol permite una serie de observaciones que son muy importantes en la selección de características centrada en el usuario y que no son fáciles de observar mediante ninguna otra herramienta disponible. Proporcionan una forma de encontrar características relevantes e irrelevantes, conjuntos espurios de características ruidosas, grupos de características similares y características opuestas, todas las cuales son tareas esenciales en diferentes escenarios de análisis de datos. Estudios de caso en áreas de aplicación centradas en documentos, imágenes y datos de sonido demuestran la capacidad del marco para alcanzar rápidamente una representación compacta satisfactoria a partir de un conjunto de características más grande.