Enfoque de Visualización Híbrida para Mostrar la Similitud de Documentos y Contenido en una Sola Vista
Autores: Andreotti, Andre Luiz Dias; Silva, Lenon Fachiano; Eler, Danilo Medeiros
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Enfoque de Visualización Híbrida para Mostrar la Similitud de Documentos y Contenido en una Sola Vista
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Proyecciones multidimensionales
Conjuntos de datos
Relaciones
Clústeres
Colecciones de documentos
Nubes de etiquetas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las técnicas de proyección multidimensional se pueden emplear para proyectar conjuntos de datos de un espacio de mayor dimensión a uno de menor dimensión (por ejemplo, espacio 2D). Estas técnicas se pueden utilizar para presentar las relaciones de las instancias del conjunto de datos en función de la distancia, agrupando o separando clústeres de instancias en el espacio proyectado. Varios trabajos han utilizado proyecciones multidimensionales para ayudar en la exploración de colecciones de documentos. A pesar de que las técnicas de proyección pueden organizar un conjunto de datos, el usuario necesita leer cada documento para comprender la generación de clústeres. Alternativamente, se pueden emplear técnicas como la extracción de temas o nubes de etiquetas para presentar un resumen del contenido de los documentos. Para minimizar el trabajo exploratorio y ayudar en el análisis de clústeres, este trabajo propone una nueva visualización híbrida para mostrar tanto la relación entre documentos como el contenido en una sola vista, empleando proyecciones multidimensionales para relacionar documentos y nubes de etiquetas. Mostramos la efectividad del enfoque propuesto en la exploración de dos colecciones de documentos compuestas por noticias del mundo.
Descripción
Las técnicas de proyección multidimensional se pueden emplear para proyectar conjuntos de datos de un espacio de mayor dimensión a uno de menor dimensión (por ejemplo, espacio 2D). Estas técnicas se pueden utilizar para presentar las relaciones de las instancias del conjunto de datos en función de la distancia, agrupando o separando clústeres de instancias en el espacio proyectado. Varios trabajos han utilizado proyecciones multidimensionales para ayudar en la exploración de colecciones de documentos. A pesar de que las técnicas de proyección pueden organizar un conjunto de datos, el usuario necesita leer cada documento para comprender la generación de clústeres. Alternativamente, se pueden emplear técnicas como la extracción de temas o nubes de etiquetas para presentar un resumen del contenido de los documentos. Para minimizar el trabajo exploratorio y ayudar en el análisis de clústeres, este trabajo propone una nueva visualización híbrida para mostrar tanto la relación entre documentos como el contenido en una sola vista, empleando proyecciones multidimensionales para relacionar documentos y nubes de etiquetas. Mostramos la efectividad del enfoque propuesto en la exploración de dos colecciones de documentos compuestas por noticias del mundo.