Análisis de transmisión de gráficos interactivos en Arkouda
Autores: Du, Zhihui; Rodriguez, Oliver Alvarado; Patchett, Joseph; Bader, David A.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Análisis de transmisión de gráficos interactivos en Arkouda
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aplicaciones
Ciberseguridad
Redes sociales
Gráficos
Análisis de transmisión
Python
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Los datos de aplicaciones emergentes, como ciberseguridad y redes sociales, pueden ser abstraídos como grafos cuyos bordes se actualizan secuencialmente en forma de un flujo. El desafiante problema de la analítica de flujo de grafos interactivos es la respuesta rápida de las consultas sobre datos de flujo de grafos de terabytes y más allá por parte de los usuarios finales. En este documento, se diseña una estructura de datos de índice doble concisa y eficiente para construir el bosquejo de un flujo de gráficos que cumpla con las consultas generales. Se desarrolla un modelo de flujo de una sola pasada, que incluye la construcción de bosquejos generales, algoritmos de análisis basados en bosquejos distribuidos y generación de soluciones de aproximación basadas en regresión, y se implementa un algoritmo de gráficos típico, el conteo de triángulos, para evaluar el método propuesto. Los resultados experimentales en flujos de gráficos de distribución de ley de potencia y normal muestran que nuestro método puede generar resultados precisos (error relativo medio inferior al 4%) con un alto rendimiento. Todos nuestros métodos y código han sido implementados en un marco de código abierto, Arkouda, y están disponibles en nuestro repositorio de GitHub, Bader-Research. Este trabajo proporciona a la gran y creciente comunidad de Python una forma poderosa de manejar datos de flujo de gráficos de terabytes y más allá utilizando sus computadoras portátiles.
Descripción
Los datos de aplicaciones emergentes, como ciberseguridad y redes sociales, pueden ser abstraídos como grafos cuyos bordes se actualizan secuencialmente en forma de un flujo. El desafiante problema de la analítica de flujo de grafos interactivos es la respuesta rápida de las consultas sobre datos de flujo de grafos de terabytes y más allá por parte de los usuarios finales. En este documento, se diseña una estructura de datos de índice doble concisa y eficiente para construir el bosquejo de un flujo de gráficos que cumpla con las consultas generales. Se desarrolla un modelo de flujo de una sola pasada, que incluye la construcción de bosquejos generales, algoritmos de análisis basados en bosquejos distribuidos y generación de soluciones de aproximación basadas en regresión, y se implementa un algoritmo de gráficos típico, el conteo de triángulos, para evaluar el método propuesto. Los resultados experimentales en flujos de gráficos de distribución de ley de potencia y normal muestran que nuestro método puede generar resultados precisos (error relativo medio inferior al 4%) con un alto rendimiento. Todos nuestros métodos y código han sido implementados en un marco de código abierto, Arkouda, y están disponibles en nuestro repositorio de GitHub, Bader-Research. Este trabajo proporciona a la gran y creciente comunidad de Python una forma poderosa de manejar datos de flujo de gráficos de terabytes y más allá utilizando sus computadoras portátiles.