logo móvil
Contáctanos

Mejores Prácticas de ETL para Comprobaciones de Calidad de Datos en Bases de Datos RIS

Autores: Azeroual, Otmane; Saake, Gunter; Abuosba, Mohammad

Idioma: Inglés

Editor: MDPI

Año: 2019

Descargar PDF

Acceso abierto

Artículo científico
2019

Mejores Prácticas de ETL para Comprobaciones de Calidad de Datos en Bases de Datos RIS


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Integración de datos
Sistemas de bases de datos federadas
Sistemas de información de investigación
Calidad de datos
Extracción
transformación y carga
Errores de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El tema de la integración de datos de fuentes de datos externas o sistemas informáticos independientes ha recibido una atención creciente recientemente en los departamentos de TI, así como a nivel de gestión, en particular en lo que respecta a la integración de datos en sistemas de bases de datos federadas. Un ejemplo de esto son los sistemas comerciales de información de investigación (RIS), que regularmente importan, limpian, transforman y preparan la información de investigación de las instituciones de una variedad de bases de datos. Además, todos estos llamados pasos deben ser proporcionados con una calidad asegurada. A medida que se cargan varias fuentes de datos internas y externas para su integración en el RIS, garantizar la calidad de la información se está convirtiendo en un desafío cada vez mayor para las instituciones de investigación. Antes de que la información de investigación se transfiera a un RIS, debe ser verificada y limpiada. Un factor importante para una integración de datos exitosa o competente es, por lo tanto, siempre la calidad de los datos. La eliminación de errores de datos (como duplicados y la armonización de la estructura de datos, datos inconsistentes y datos obsoletos, etc.) son tareas esenciales de la integración de datos utilizando procesos de extracción, transformación y carga (ETL). Los datos se extraen de los sistemas de origen, se transforman y se cargan en el RIS. En este punto, se controlan y resuelven los conflictos entre diferentes fuentes de datos, así como se eliminan los problemas de calidad de los datos durante la integración de datos. En este contexto, nuestro artículo presenta el proceso de transformación de datos en el contexto del RIS, que obtiene una visión general de la calidad de la información de investigación en las fuentes de datos internas y externas de una institución durante su integración en el RIS. Además, se abordará la cuestión de cómo controlar y mejorar los problemas de calidad durante el proceso de integración en el RIS.

Otros recursos que podrían interesarte

Temas Virtualpro