Modelado de Temas de Datos Abiertos del Gobierno y Desarrollo de Taxonomía
Autores: Ferencek, Alja; Kljaji Bortnar, Mirjana
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Modelado de Temas de Datos Abiertos del Gobierno y Desarrollo de Taxonomía
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Expectativas
Datos abiertos del gobierno
Impacto
Taxonomía
Aprendizaje automático
Categorías temáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Las expectativas para el (re)uso de los datos abiertos del gobierno (DAG) son altas. Sin embargo, medir su impacto sigue siendo un desafío, ya que sus efectos no son únicamente económicos, sino también a largo plazo y se extienden a múltiples dominios. Para evaluar con precisión estos impactos, primero debemos entender dónde ocurren. Esta investigación presenta un enfoque estructurado para desarrollar una taxonomía de las áreas de impacto de los datos abiertos del gobierno (DAG) utilizando modelado de temas impulsado por aprendizaje automático y refinamiento iterativo de la taxonomía. Al analizar un conjunto de datos de 697 casos de uso de DAG, empleamos varias técnicas de aprendizaje automático, incluyendo Asignación de Dirichlet Latente (LDA), Factorización de Matrices No Negativas (NMF) y Proceso de Dirichlet Jerárquico (HDP), para extraer categorías temáticas y construir una taxonomía estructurada. La taxonomía final comprende siete dimensiones de alto nivel: Sociedad, Salud, Infraestructura, Educación, Innovación, Gobernanza y Medio Ambiente, cada una con subdominios y características específicas. Nuestros hallazgos revelan que el impacto de los DAG se extiende más allá de la gobernanza y la transparencia, influyendo en la educación, la sostenibilidad y los servicios públicos. Nuestro enfoque proporciona una metodología escalable y basada en datos para categorizar las áreas de impacto de los DAG en comparación con investigaciones anteriores que dependen de clasificaciones predefinidas o taxonomías manuales. Sin embargo, el estudio tiene limitaciones, incluyendo un conjunto de datos relativamente pequeño, casos de uso breves y la subjetividad inherente a la clasificación taxonómica, lo que requiere una validación adicional por parte de expertos en la materia. Esta investigación contribuye a la evaluación sistemática de las iniciativas de DAG y proporciona un marco fundamental para los responsables de políticas y los investigadores que buscan maximizar los beneficios de los datos abiertos.
Descripción
Las expectativas para el (re)uso de los datos abiertos del gobierno (DAG) son altas. Sin embargo, medir su impacto sigue siendo un desafío, ya que sus efectos no son únicamente económicos, sino también a largo plazo y se extienden a múltiples dominios. Para evaluar con precisión estos impactos, primero debemos entender dónde ocurren. Esta investigación presenta un enfoque estructurado para desarrollar una taxonomía de las áreas de impacto de los datos abiertos del gobierno (DAG) utilizando modelado de temas impulsado por aprendizaje automático y refinamiento iterativo de la taxonomía. Al analizar un conjunto de datos de 697 casos de uso de DAG, empleamos varias técnicas de aprendizaje automático, incluyendo Asignación de Dirichlet Latente (LDA), Factorización de Matrices No Negativas (NMF) y Proceso de Dirichlet Jerárquico (HDP), para extraer categorías temáticas y construir una taxonomía estructurada. La taxonomía final comprende siete dimensiones de alto nivel: Sociedad, Salud, Infraestructura, Educación, Innovación, Gobernanza y Medio Ambiente, cada una con subdominios y características específicas. Nuestros hallazgos revelan que el impacto de los DAG se extiende más allá de la gobernanza y la transparencia, influyendo en la educación, la sostenibilidad y los servicios públicos. Nuestro enfoque proporciona una metodología escalable y basada en datos para categorizar las áreas de impacto de los DAG en comparación con investigaciones anteriores que dependen de clasificaciones predefinidas o taxonomías manuales. Sin embargo, el estudio tiene limitaciones, incluyendo un conjunto de datos relativamente pequeño, casos de uso breves y la subjetividad inherente a la clasificación taxonómica, lo que requiere una validación adicional por parte de expertos en la materia. Esta investigación contribuye a la evaluación sistemática de las iniciativas de DAG y proporciona un marco fundamental para los responsables de políticas y los investigadores que buscan maximizar los beneficios de los datos abiertos.