Un marco probabilístico conceptual para la agregación de anotaciones de datos de ciencia ciudadana
Autores: Cerquides, Jesus; Mülâyim, Mehmet Ouz; Hernández-González, Jerónimo; Ravi Shankar, Amudha; Fernandez-Marquez, Jose Luis
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un marco probabilístico conceptual para la agregación de anotaciones de datos de ciencia ciudadana
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Voluntarios
Ciencia
Calidad de datos
Ciencia ciudadana
Precisión
Metodología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Durante la última década, cientos de miles de voluntarios han contribuido a la ciencia recolectando o analizando datos. Esta participación pública en la ciencia, también conocida como ciencia ciudadana, ha contribuido a descubrimientos significativos y ha dado lugar a publicaciones en importantes revistas científicas. Sin embargo, se ha prestado poca atención a los problemas de calidad de datos. En este trabajo argumentamos que poder determinar la precisión de los datos obtenidos mediante la participación ciudadana es una cuestión fundamental y señalamos que, para muchos escenarios de la vida real, faltan herramientas matemáticas y procesos para la evaluación de la calidad de los datos. Proponemos una metodología probabilística para la evaluación de la precisión de los datos de etiquetado obtenidos mediante la participación ciudadana en la ciencia. La metodología se basa en un formalismo abstracto de modelo gráfico probabilístico, que se muestra que generaliza algunos modelos de agregación de etiquetas ya existentes. Mostramos cómo hacer uso práctico de la metodología a través de una comparación de datos obtenidos de diferentes comunidades de ciencia ciudadana que analizan el terremoto que tuvo lugar en Albania en 2019.
Descripción
Durante la última década, cientos de miles de voluntarios han contribuido a la ciencia recolectando o analizando datos. Esta participación pública en la ciencia, también conocida como ciencia ciudadana, ha contribuido a descubrimientos significativos y ha dado lugar a publicaciones en importantes revistas científicas. Sin embargo, se ha prestado poca atención a los problemas de calidad de datos. En este trabajo argumentamos que poder determinar la precisión de los datos obtenidos mediante la participación ciudadana es una cuestión fundamental y señalamos que, para muchos escenarios de la vida real, faltan herramientas matemáticas y procesos para la evaluación de la calidad de los datos. Proponemos una metodología probabilística para la evaluación de la precisión de los datos de etiquetado obtenidos mediante la participación ciudadana en la ciencia. La metodología se basa en un formalismo abstracto de modelo gráfico probabilístico, que se muestra que generaliza algunos modelos de agregación de etiquetas ya existentes. Mostramos cómo hacer uso práctico de la metodología a través de una comparación de datos obtenidos de diferentes comunidades de ciencia ciudadana que analizan el terremoto que tuvo lugar en Albania en 2019.