Un marco de aprendizaje automático para la recolección y armonización de datos culturales y turísticos
Autores: Deligiannis, Kimon; Tryfonopoulos, Christos; Raftopoulou, Paraskevi; Vassilakis, Costas; Kaffes, Vassilis; Skiadopoulos, Spiros
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un marco de aprendizaje automático para la recolección y armonización de datos culturales y turísticos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Información cultural
Información turística
Fuentes
Monumentos
Atracciones
Marco
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La información cultural y turística está cada vez más disponible a través de una multitud de fuentes heterogéneas, incluyendo repositorios oficiales, plataformas comunitarias e iniciativas de datos abiertos. Si bien los monumentos prominentes suelen estar cubiertos en las fuentes, las atracciones menos conocidas también están documentadas con diferentes grados de detalle, lo que resulta en contenido fragmentado, superpuesto o complementario. Para permitir un acceso integrado a esta riqueza de información, se requieren mecanismos de recolección y consolidación para recopilar, reconciliar y unificar contenido distribuido que se refiera a las mismas entidades. Este documento presenta un marco impulsado por aprendizaje automático para la recolección, homogeneización y aumento de datos culturales y turísticos a través de fuentes multilingües. Nuestro enfoque aborda la resolución de entidades, la detección de duplicados y la armonización de contenido, sentando las bases para representaciones enriquecidas y unificadas de atracciones y puntos de interés. El marco está diseñado para soportar tuberías de integración escalables y puede ser implementado en aplicaciones destinadas a la promoción del turismo, el patrimonio digital y los servicios de viaje inteligentes.
Descripción
La información cultural y turística está cada vez más disponible a través de una multitud de fuentes heterogéneas, incluyendo repositorios oficiales, plataformas comunitarias e iniciativas de datos abiertos. Si bien los monumentos prominentes suelen estar cubiertos en las fuentes, las atracciones menos conocidas también están documentadas con diferentes grados de detalle, lo que resulta en contenido fragmentado, superpuesto o complementario. Para permitir un acceso integrado a esta riqueza de información, se requieren mecanismos de recolección y consolidación para recopilar, reconciliar y unificar contenido distribuido que se refiera a las mismas entidades. Este documento presenta un marco impulsado por aprendizaje automático para la recolección, homogeneización y aumento de datos culturales y turísticos a través de fuentes multilingües. Nuestro enfoque aborda la resolución de entidades, la detección de duplicados y la armonización de contenido, sentando las bases para representaciones enriquecidas y unificadas de atracciones y puntos de interés. El marco está diseñado para soportar tuberías de integración escalables y puede ser implementado en aplicaciones destinadas a la promoción del turismo, el patrimonio digital y los servicios de viaje inteligentes.