Reparación de datos de múltiples fuentes: una encuesta exhaustiva
Autores: Ye, Chen; Duan, Haoyang; Zhang, Hengtong; Zhang, Hua; Wang, Hongzhi; Dai, Guojun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reparación de datos de múltiples fuentes: una encuesta exhaustiva
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Integración de datos
Errores
Datos de múltiples fuentes
Métodos de reparación
Superposición de información de entidades
Conflictos de valores de atributos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En la era del Big Data, integrar información de múltiples fuentes ha demostrado ser valioso en varios campos. Para garantizar un suministro de datos de múltiples fuentes de alta calidad, reparar diferentes tipos de errores en los datos de múltiples fuentes se vuelve crítico. Este documento categoriza los errores en los datos de múltiples fuentes en solapamiento de información de entidad, conflictos de valores de atributo e inconsistencias de valores de atributo. Primero resumimos los métodos de reparación existentes para estos errores y luego examinamos y revisamos el estudio de la detección y reparación de errores de tipo compuesto en datos de múltiples fuentes. Finalmente, indicamos nuevas direcciones de investigación en la reparación de datos de múltiples fuentes.
Descripción
En la era del Big Data, integrar información de múltiples fuentes ha demostrado ser valioso en varios campos. Para garantizar un suministro de datos de múltiples fuentes de alta calidad, reparar diferentes tipos de errores en los datos de múltiples fuentes se vuelve crítico. Este documento categoriza los errores en los datos de múltiples fuentes en solapamiento de información de entidad, conflictos de valores de atributo e inconsistencias de valores de atributo. Primero resumimos los métodos de reparación existentes para estos errores y luego examinamos y revisamos el estudio de la detección y reparación de errores de tipo compuesto en datos de múltiples fuentes. Finalmente, indicamos nuevas direcciones de investigación en la reparación de datos de múltiples fuentes.