Diseño de Sistema para Utilizar la Experiencia en el Dominio para el Análisis de Datos Exploratorio Visual
Autores: Langer, Tristan; Meisen, Tobias
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Diseño de Sistema para Utilizar la Experiencia en el Dominio para el Análisis de Datos Exploratorio Visual
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Científicos de datos
Conocimiento del dominio
Análisis exploratorio de datos
Conocimientos
Diseño de sistemas
Interacciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El análisis exploratorio de datos (EDA) es un proceso iterativo en el que los científicos de datos interactúan con los datos para extraer información sobre su calidad y forma, así como para obtener conocimientos y nuevas perspectivas sobre el dominio relacionado con el conjunto de datos. Sin embargo, los científicos de datos rara vez son expertos en el dominio que tienen un conocimiento tangible sobre este. Integrar el conocimiento del dominio en el proceso analítico es un desafío complejo que generalmente requiere una comunicación constante entre los científicos de datos y los expertos en el dominio. Por esta razón, es deseable reutilizar las percepciones del dominio de los análisis exploratorios en casos de uso similares. Con este objetivo en mente, presentamos un diseño conceptual del sistema sobre cómo extraer la experiencia del dominio mientras se realiza EDA y utilizarla para guiar a otros científicos de datos en casos de uso similares. Nuestro diseño de sistema introduce dos conceptos, almacenamiento de interacción y almacenamiento de contexto de análisis, para registrar la interacción del usuario y los puntos de datos interesantes durante un análisis exploratorio. Para nuevos casos de uso, identifica interacciones históricas de casos de uso similares y facilita los datos registrados para construir secuencias de interacción candidatas y predecir su posible conocimiento, es decir, el conocimiento generado al realizar la secuencia. Basado en estas predicciones, el sistema recomienda las secuencias con el mayor conocimiento predicho a los científicos de datos. Implementamos un prototipo para probar la viabilidad general de nuestro diseño de sistema y permitir una investigación adicional en esta área. Dentro del prototipo, presentamos un caso de uso ejemplar que demuestra la utilidad de las interacciones recomendadas. Finalmente, ofrecemos una reflexión crítica sobre nuestro primer prototipo y discutimos las oportunidades de investigación que resultan de nuestro diseño de sistema.
Descripción
El análisis exploratorio de datos (EDA) es un proceso iterativo en el que los científicos de datos interactúan con los datos para extraer información sobre su calidad y forma, así como para obtener conocimientos y nuevas perspectivas sobre el dominio relacionado con el conjunto de datos. Sin embargo, los científicos de datos rara vez son expertos en el dominio que tienen un conocimiento tangible sobre este. Integrar el conocimiento del dominio en el proceso analítico es un desafío complejo que generalmente requiere una comunicación constante entre los científicos de datos y los expertos en el dominio. Por esta razón, es deseable reutilizar las percepciones del dominio de los análisis exploratorios en casos de uso similares. Con este objetivo en mente, presentamos un diseño conceptual del sistema sobre cómo extraer la experiencia del dominio mientras se realiza EDA y utilizarla para guiar a otros científicos de datos en casos de uso similares. Nuestro diseño de sistema introduce dos conceptos, almacenamiento de interacción y almacenamiento de contexto de análisis, para registrar la interacción del usuario y los puntos de datos interesantes durante un análisis exploratorio. Para nuevos casos de uso, identifica interacciones históricas de casos de uso similares y facilita los datos registrados para construir secuencias de interacción candidatas y predecir su posible conocimiento, es decir, el conocimiento generado al realizar la secuencia. Basado en estas predicciones, el sistema recomienda las secuencias con el mayor conocimiento predicho a los científicos de datos. Implementamos un prototipo para probar la viabilidad general de nuestro diseño de sistema y permitir una investigación adicional en esta área. Dentro del prototipo, presentamos un caso de uso ejemplar que demuestra la utilidad de las interacciones recomendadas. Finalmente, ofrecemos una reflexión crítica sobre nuestro primer prototipo y discutimos las oportunidades de investigación que resultan de nuestro diseño de sistema.