logo móvil
Contáctanos

Diseño de Sistema para Utilizar la Experiencia en el Dominio para el Análisis de Datos Exploratorio Visual

Autores: Langer, Tristan; Meisen, Tobias

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Diseño de Sistema para Utilizar la Experiencia en el Dominio para el Análisis de Datos Exploratorio Visual


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Científicos de datos
Conocimiento del dominio
Análisis exploratorio de datos
Conocimientos
Diseño de sistemas
Interacciones

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El análisis exploratorio de datos (EDA) es un proceso iterativo en el que los científicos de datos interactúan con los datos para extraer información sobre su calidad y forma, así como para obtener conocimientos y nuevas perspectivas sobre el dominio relacionado con el conjunto de datos. Sin embargo, los científicos de datos rara vez son expertos en el dominio que tienen un conocimiento tangible sobre este. Integrar el conocimiento del dominio en el proceso analítico es un desafío complejo que generalmente requiere una comunicación constante entre los científicos de datos y los expertos en el dominio. Por esta razón, es deseable reutilizar las percepciones del dominio de los análisis exploratorios en casos de uso similares. Con este objetivo en mente, presentamos un diseño conceptual del sistema sobre cómo extraer la experiencia del dominio mientras se realiza EDA y utilizarla para guiar a otros científicos de datos en casos de uso similares. Nuestro diseño de sistema introduce dos conceptos, almacenamiento de interacción y almacenamiento de contexto de análisis, para registrar la interacción del usuario y los puntos de datos interesantes durante un análisis exploratorio. Para nuevos casos de uso, identifica interacciones históricas de casos de uso similares y facilita los datos registrados para construir secuencias de interacción candidatas y predecir su posible conocimiento, es decir, el conocimiento generado al realizar la secuencia. Basado en estas predicciones, el sistema recomienda las secuencias con el mayor conocimiento predicho a los científicos de datos. Implementamos un prototipo para probar la viabilidad general de nuestro diseño de sistema y permitir una investigación adicional en esta área. Dentro del prototipo, presentamos un caso de uso ejemplar que demuestra la utilidad de las interacciones recomendadas. Finalmente, ofrecemos una reflexión crítica sobre nuestro primer prototipo y discutimos las oportunidades de investigación que resultan de nuestro diseño de sistema.

Otros recursos que podrían interesarte

Temas Virtualpro