Estrategias de paralelismo para la evaluación retardada de la entropía de transferencia de Big Data
Autores: Dourado, Jonas R.; Oliveira Júnior, Jordão Natal de; Maciel, Carlos D.
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Estrategias de paralelismo para la evaluación retardada de la entropía de transferencia de Big Data
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Datos
Tecnologías
Grandes datos
Causalidad
Entropía de Transferencia de Retardo
Paralelismo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Los datos generados y recopilados han estado aumentando con la popularización de tecnologías como Internet de las cosas, redes sociales y teléfonos inteligentes, lo que ha llevado a la creación del término big data. Una clase de información oculta en el big data es la causalidad. Entre las herramientas para inferir relaciones causales, se encuentra la Entropía de Transferencia de Retraso (DTE); sin embargo, requiere una alta potencia de procesamiento. Se han propuesto muchos enfoques para superar los problemas de rendimiento de DTE, como las implementaciones en GPU y FPGA. Nuestro estudio comparó diferentes estrategias paralelas para calcular DTE a partir de series de datos grandes utilizando un clúster heterogéneo de Beowulf. El Paralelismo de Tareas fue significativamente más rápido en comparación con el Paralelismo de Datos. Con la tendencia de big data a la vista, estos resultados pueden permitir un análisis de conjuntos de datos más grandes o una mejor evidencia estadística.
Descripción
Los datos generados y recopilados han estado aumentando con la popularización de tecnologías como Internet de las cosas, redes sociales y teléfonos inteligentes, lo que ha llevado a la creación del término big data. Una clase de información oculta en el big data es la causalidad. Entre las herramientas para inferir relaciones causales, se encuentra la Entropía de Transferencia de Retraso (DTE); sin embargo, requiere una alta potencia de procesamiento. Se han propuesto muchos enfoques para superar los problemas de rendimiento de DTE, como las implementaciones en GPU y FPGA. Nuestro estudio comparó diferentes estrategias paralelas para calcular DTE a partir de series de datos grandes utilizando un clúster heterogéneo de Beowulf. El Paralelismo de Tareas fue significativamente más rápido en comparación con el Paralelismo de Datos. Con la tendencia de big data a la vista, estos resultados pueden permitir un análisis de conjuntos de datos más grandes o una mejor evidencia estadística.