Estrategias de Integración y Almacenamiento de Datos en Sistemas Analíticos Heterogéneos: Arquitecturas, Métodos y Desafíos de Interoperabilidad
Autores: Koukaras, Paraskevas
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Estrategias de Integración y Almacenamiento de Datos en Sistemas Analíticos Heterogéneos: Arquitecturas, Métodos y Desafíos de Interoperabilidad
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Accesibilidad de datos
Métodos de integración
Arquitecturas de almacenamiento
Gestión de metadatos
Compensaciones de rendimiento
Plataformas analíticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En el escenario actual de accesibilidad universal de datos, las organizaciones enfrentan desafíos altamente complejos relacionados con la integración y el procesamiento de conjuntos de datos diversos para satisfacer sus necesidades analíticas. Este artículo de revisión analiza métodos tradicionales e innovadores utilizados para el almacenamiento e integración de datos, con un enfoque particular en sus implicaciones para la escalabilidad, consistencia e interoperabilidad dentro de un ecosistema analítico. En particular, contribuye con una taxonomía de capas cruzadas que vincula mecanismos de integración (coincidencia de esquemas, resolución de entidades y enriquecimiento semántico) a sustratos de almacenamiento/consulta (almacenes de filas/columnas, NoSQL, lakehouse y federación), junto con tablas y figuras comparativas que sintetizan compensaciones y palancas de rendimiento/gobernanza. A través de soluciones de mapeo de esquemas que abordan los desafíos provocados por la heterogeneidad estructural, arquitecturas de almacenamiento que varían desde soluciones de almacenamiento tradicionales hasta soluciones de almacenamiento en la nube, e integración de tuberías ETL utilizando procesadores de consultas federados, la investigación presta atención específica a la aplicación de la gestión de metadatos, con un enfoque en el enriquecimiento semántico utilizando ontologías y gestión de linaje para permitir la trazabilidad y gobernanza de extremo a extremo. También cubre puntos críticos de rendimiento y técnicas de almacenamiento en caché, junto con compensaciones de consistencia que surgen de sistemas distribuidos. Estudios de caso empíricos de aplicaciones reales en lakehouses empresariales, actividades de exploración científica y aplicaciones de gobernanza pública sirven para invocar esta revisión. A partir de este trabajo surge la posibilidad de futuras direcciones en plataformas analíticas convergentes con soporte para múltiples cargas de trabajo, junto con orquestación centrada en metadatos con provisiones para integración basada en IA. Combinar el avance tecnológico con consideraciones prácticas resulta en un recurso habilitador para investigadores y profesionales que buscan la creación de infraestructuras de datos tolerantes a fallos, confiables y preparadas para el futuro. Esta revisión está dirigida principalmente a investigadores, arquitectos de sistemas y profesionales avanzados que diseñan y evalúan plataformas analíticas heterogéneas. También ofrece valor a estudiantes de posgrado al servir como una visión general estructurada de métodos contemporáneos, cerrando así la brecha entre el conocimiento académico y la práctica industrial.
Descripción
En el escenario actual de accesibilidad universal de datos, las organizaciones enfrentan desafíos altamente complejos relacionados con la integración y el procesamiento de conjuntos de datos diversos para satisfacer sus necesidades analíticas. Este artículo de revisión analiza métodos tradicionales e innovadores utilizados para el almacenamiento e integración de datos, con un enfoque particular en sus implicaciones para la escalabilidad, consistencia e interoperabilidad dentro de un ecosistema analítico. En particular, contribuye con una taxonomía de capas cruzadas que vincula mecanismos de integración (coincidencia de esquemas, resolución de entidades y enriquecimiento semántico) a sustratos de almacenamiento/consulta (almacenes de filas/columnas, NoSQL, lakehouse y federación), junto con tablas y figuras comparativas que sintetizan compensaciones y palancas de rendimiento/gobernanza. A través de soluciones de mapeo de esquemas que abordan los desafíos provocados por la heterogeneidad estructural, arquitecturas de almacenamiento que varían desde soluciones de almacenamiento tradicionales hasta soluciones de almacenamiento en la nube, e integración de tuberías ETL utilizando procesadores de consultas federados, la investigación presta atención específica a la aplicación de la gestión de metadatos, con un enfoque en el enriquecimiento semántico utilizando ontologías y gestión de linaje para permitir la trazabilidad y gobernanza de extremo a extremo. También cubre puntos críticos de rendimiento y técnicas de almacenamiento en caché, junto con compensaciones de consistencia que surgen de sistemas distribuidos. Estudios de caso empíricos de aplicaciones reales en lakehouses empresariales, actividades de exploración científica y aplicaciones de gobernanza pública sirven para invocar esta revisión. A partir de este trabajo surge la posibilidad de futuras direcciones en plataformas analíticas convergentes con soporte para múltiples cargas de trabajo, junto con orquestación centrada en metadatos con provisiones para integración basada en IA. Combinar el avance tecnológico con consideraciones prácticas resulta en un recurso habilitador para investigadores y profesionales que buscan la creación de infraestructuras de datos tolerantes a fallos, confiables y preparadas para el futuro. Esta revisión está dirigida principalmente a investigadores, arquitectos de sistemas y profesionales avanzados que diseñan y evalúan plataformas analíticas heterogéneas. También ofrece valor a estudiantes de posgrado al servir como una visión general estructurada de métodos contemporáneos, cerrando así la brecha entre el conocimiento académico y la práctica industrial.