logo móvil
Contáctanos

Glifos de Apariencia de Clúster: Una Metodología para Ilustrar Patrones de Datos de Alta Dimensionalidad en Disposiciones de Datos en 2-D

Autores: Lee, Jenny Hyunjung; Coelho, Darius; Mueller, Klaus

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Glifos de Apariencia de Clúster: Una Metodología para Ilustrar Patrones de Datos de Alta Dimensionalidad en Disposiciones de Datos en 2-D


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Embeddings
Distorsiones
Apariencia de clúster
Scagnostics
Patrones de textura
Glifos de apariencia de clúster

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Las incrustaciones en un espacio bidimensional, como el Escalado Multidimensional (MDS), son un medio popular para obtener información sobre las relaciones en datos de alta dimensión. Sin embargo, en todos los casos excepto en los más simples, estas incrustaciones sufren distorsiones significativas, lo que puede llevar a interpretaciones erróneas de los datos de alta dimensión. Estas distorsiones ocurren tanto a nivel global entre clústeres como a nivel local dentro de los clústeres. La primera conduce a una mala interpretación de las distancias entre las diversas poblaciones de clústeres N-D, mientras que la segunda dificulta la apreciación de sus formas y composiciones individuales, que llamamos apariencia del clúster. La distorsión de la apariencia del clúster que se incurre en la incrustación 2-D es inevitable, ya que tales incrustaciones de baja dimensión siempre conllevan la pérdida de parte de la varianza intra-clúster. En este artículo, proponemos técnicas para superar estas limitaciones al transmitir la apariencia del clúster N-D a través de un marco inspirado en el diseño ilustrativo. Aquí utilizamos Scagnostics, que ofrece un conjunto de descriptores de características intuitivas para describir la apariencia de gráficos de dispersión 2-D. Extendemos el análisis de Scagnostics a N-D y luego diseñamos y probamos, a través de estudios de usuarios basados en la multitud, un conjunto de patrones de textura parametrizables que se mapean a los diversos descriptores de Scagnostics. Finalmente, incrustamos estos patrones de textura informados por Scagnostics en formas derivadas de estadísticas N-D para obtener lo que llamamos Glifos de Apariencia de Clúster. Demostramos nuestro marco con un conjunto de datos adquirido para analizar los tiempos de ejecución de programas en sistemas de archivos.

Otros recursos que podrían interesarte

Temas Virtualpro