Evaluación del rendimiento de estrategias de bases de datos distribuidas utilizando Docker como servicio para datos de IoT industrial: Aplicación a la Industria 4.0
Autores: Gkamas, Theodosios; Karaiskos, Vasileios; Kontogiannis, Sotirios
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Evaluación del rendimiento de estrategias de bases de datos distribuidas utilizando Docker como servicio para datos de IoT industrial: Aplicación a la Industria 4.0
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Bases de datos
Nube
IoT
PostgreSQL
MongoDB
Experimental
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las bases de datos son una parte integral de casi todas las aplicaciones en la actualidad. Por ejemplo, las aplicaciones que utilizan datos sensoriales del Internet de las Cosas (IoT), como en la Industria 4.0, son un ejemplo clásico de un sistema de almacenamiento organizado. Debido a su enorme tamaño, puede ser almacenado en la nube. Este documento presenta la propuesta de los autores para mediciones sensoriales centradas en la nube y adquisición de mediciones. Luego, se centra en evaluar motores de almacenamiento en la nube industrial para funciones sensoriales, experimentando con tres tipos de Sistemas de Gestión de Bases de Datos (DBMS) distribuidos de código abierto: MongoDB y PostgreSQL, con dos formas de esquemas de PostgreSQL (basados en Javascript Object Notation (JSON) y relacionales), en comparación con sus respectivas estrategias de escalado horizontal. Se han realizado varios casos experimentales para medir el tiempo de respuesta de las consultas a la base de datos, el rendimiento alcanzado y las fallas correspondientes. Se han probado a fondo tres escenarios distintos, los más comunes pero ampliamente utilizados: (i) inserciones de datos, (ii) consultas de selección/búsqueda y (iii) consultas relacionadas con funciones de correlación agregada. Los resultados experimentales concluyeron que PostgreSQL con JSON logra un 5-57% mejor respuesta que MongoDB para las consultas de inserción (casos de implementaciones nativas, de dos y cuatro fragmentos), mientras que, por el contrario, MongoDB logró un 56-91% más de rendimiento que PostgreSQL para la misma configuración. Además, para los casos experimentales de inserción de datos de seis y ocho fragmentos, MongoDB se desempeñó un 13-20% más que Postgres en tiempo de respuesta, logrando un rendimiento x 2 veces más alto. PostgreSQL relacional fue x 2 veces más rápido que MongoDB en su implementación independiente para consultas de selección. Al mismo tiempo, MongoDB logró respuestas un 19-31% más rápidas y un rendimiento un 44-63% más alto que PostgreSQL en los cuatro subcasos de fragmentación probados (dos, cuatro, seis, ocho fragmentos), respectivamente. Finalmente, el PostgreSQL relacional superó significativamente a MongoDB y a PostgreSQL JSON en todos los experimentos de función de correlación, con mejoras de rendimiento de MongoDB, cerrando la brecha con PostgreSQL hacia la minimización del tiempo de respuesta al 26% y 3% para seis y ocho fragmentos, respectivamente, y logrando ganancias significativas hacia el rendimiento promedio alcanzado.
Descripción
Las bases de datos son una parte integral de casi todas las aplicaciones en la actualidad. Por ejemplo, las aplicaciones que utilizan datos sensoriales del Internet de las Cosas (IoT), como en la Industria 4.0, son un ejemplo clásico de un sistema de almacenamiento organizado. Debido a su enorme tamaño, puede ser almacenado en la nube. Este documento presenta la propuesta de los autores para mediciones sensoriales centradas en la nube y adquisición de mediciones. Luego, se centra en evaluar motores de almacenamiento en la nube industrial para funciones sensoriales, experimentando con tres tipos de Sistemas de Gestión de Bases de Datos (DBMS) distribuidos de código abierto: MongoDB y PostgreSQL, con dos formas de esquemas de PostgreSQL (basados en Javascript Object Notation (JSON) y relacionales), en comparación con sus respectivas estrategias de escalado horizontal. Se han realizado varios casos experimentales para medir el tiempo de respuesta de las consultas a la base de datos, el rendimiento alcanzado y las fallas correspondientes. Se han probado a fondo tres escenarios distintos, los más comunes pero ampliamente utilizados: (i) inserciones de datos, (ii) consultas de selección/búsqueda y (iii) consultas relacionadas con funciones de correlación agregada. Los resultados experimentales concluyeron que PostgreSQL con JSON logra un 5-57% mejor respuesta que MongoDB para las consultas de inserción (casos de implementaciones nativas, de dos y cuatro fragmentos), mientras que, por el contrario, MongoDB logró un 56-91% más de rendimiento que PostgreSQL para la misma configuración. Además, para los casos experimentales de inserción de datos de seis y ocho fragmentos, MongoDB se desempeñó un 13-20% más que Postgres en tiempo de respuesta, logrando un rendimiento x 2 veces más alto. PostgreSQL relacional fue x 2 veces más rápido que MongoDB en su implementación independiente para consultas de selección. Al mismo tiempo, MongoDB logró respuestas un 19-31% más rápidas y un rendimiento un 44-63% más alto que PostgreSQL en los cuatro subcasos de fragmentación probados (dos, cuatro, seis, ocho fragmentos), respectivamente. Finalmente, el PostgreSQL relacional superó significativamente a MongoDB y a PostgreSQL JSON en todos los experimentos de función de correlación, con mejoras de rendimiento de MongoDB, cerrando la brecha con PostgreSQL hacia la minimización del tiempo de respuesta al 26% y 3% para seis y ocho fragmentos, respectivamente, y logrando ganancias significativas hacia el rendimiento promedio alcanzado.