Calidad de datos y confianza: revisión de desafíos y oportunidades para el intercambio de datos en IoT
Autores: Byabazaire, John; O"Hare, Gregory; Delaney, Declan
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Calidad de datos y confianza: revisión de desafíos y oportunidades para el intercambio de datos en IoT
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Datos
Calidad
IoT
Compartidas
Aplicaciones
Métricas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La investigación existente reconoce el papel crítico de los datos de calidad en la actual era de big data e Internet de las cosas (IoT). Los datos de calidad tienen un impacto directo en los resultados del modelo y, por lo tanto, en las decisiones comerciales. El crecimiento en el número de dispositivos conectados a IoT dificulta el acceso a la calidad de los datos utilizando métodos de evaluación tradicionales. Esto se ve exacerbado por la necesidad de compartir datos entre diferentes dominios de IoT, ya que aumenta la heterogeneidad de los datos. IoT compartido de datos define una nueva perspectiva de aplicaciones de IoT que se benefician de compartir datos entre diferentes dominios de IoT para crear nuevas aplicaciones de casos de uso. Por ejemplo, compartir datos entre el transporte inteligente y la industria inteligente puede llevar a otras aplicaciones de casos de uso, como la gestión logística inteligente y la gestión de almacenes. Los beneficios de tales aplicaciones, sin embargo, solo se pueden lograr si los datos compartidos tienen una calidad aceptable. Hay tres prácticas principales en los enfoques de determinación de la calidad de datos (DQ) que están restringiendo su uso efectivo en plataformas de datos compartidos: (1) la mayoría de las técnicas de DQ validan los datos de prueba frente a una cantidad conocida considerada como referencia; una referencia de oro. (2) se utilizan conjuntos estrechos de métricas estáticas para describir la calidad. Cada consumidor utiliza estas métricas de manera similar. (3) la calidad de los datos se evalúa en etapas aisladas a lo largo del pipeline de procesamiento. IoT compartido de datos presenta desafíos únicos; (1) cada aplicación y caso de uso en IoT compartido tiene una descripción única de la calidad de los datos y requiere un conjunto diferente de métricas. Esto conduce a una extensa lista de dimensiones de DQ que son difíciles de implementar en aplicaciones del mundo real. (2) la mayoría de los datos en escenarios de IoT no tienen una referencia de oro. (3) factores que ponen en peligro la DQ en IoT compartido existen a lo largo de todo el modelo de big data, desde la recopilación de datos hasta la visualización de datos y su uso. Este documento tiene como objetivo describir IoT compartido de datos y piscinas de datos compartidos, resaltando la importancia de compartir datos de calidad en diversos dominios. El artículo examina cómo podemos usar la confianza como medida de calidad en IoT compartido de datos. Concluimos que los investigadores pueden combinar técnicas basadas en la confianza con blockchain para una evaluación segura de calidad de datos de extremo a extremo.
Descripción
La investigación existente reconoce el papel crítico de los datos de calidad en la actual era de big data e Internet de las cosas (IoT). Los datos de calidad tienen un impacto directo en los resultados del modelo y, por lo tanto, en las decisiones comerciales. El crecimiento en el número de dispositivos conectados a IoT dificulta el acceso a la calidad de los datos utilizando métodos de evaluación tradicionales. Esto se ve exacerbado por la necesidad de compartir datos entre diferentes dominios de IoT, ya que aumenta la heterogeneidad de los datos. IoT compartido de datos define una nueva perspectiva de aplicaciones de IoT que se benefician de compartir datos entre diferentes dominios de IoT para crear nuevas aplicaciones de casos de uso. Por ejemplo, compartir datos entre el transporte inteligente y la industria inteligente puede llevar a otras aplicaciones de casos de uso, como la gestión logística inteligente y la gestión de almacenes. Los beneficios de tales aplicaciones, sin embargo, solo se pueden lograr si los datos compartidos tienen una calidad aceptable. Hay tres prácticas principales en los enfoques de determinación de la calidad de datos (DQ) que están restringiendo su uso efectivo en plataformas de datos compartidos: (1) la mayoría de las técnicas de DQ validan los datos de prueba frente a una cantidad conocida considerada como referencia; una referencia de oro. (2) se utilizan conjuntos estrechos de métricas estáticas para describir la calidad. Cada consumidor utiliza estas métricas de manera similar. (3) la calidad de los datos se evalúa en etapas aisladas a lo largo del pipeline de procesamiento. IoT compartido de datos presenta desafíos únicos; (1) cada aplicación y caso de uso en IoT compartido tiene una descripción única de la calidad de los datos y requiere un conjunto diferente de métricas. Esto conduce a una extensa lista de dimensiones de DQ que son difíciles de implementar en aplicaciones del mundo real. (2) la mayoría de los datos en escenarios de IoT no tienen una referencia de oro. (3) factores que ponen en peligro la DQ en IoT compartido existen a lo largo de todo el modelo de big data, desde la recopilación de datos hasta la visualización de datos y su uso. Este documento tiene como objetivo describir IoT compartido de datos y piscinas de datos compartidos, resaltando la importancia de compartir datos de calidad en diversos dominios. El artículo examina cómo podemos usar la confianza como medida de calidad en IoT compartido de datos. Concluimos que los investigadores pueden combinar técnicas basadas en la confianza con blockchain para una evaluación segura de calidad de datos de extremo a extremo.