Mejorando la Calidad de Búsqueda en Sistemas de Etiquetado de Números de Bib Recopilados por Multitudes Usando Fusión de Datos
Autores: Ponomarev, Andrew
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Mejorando la Calidad de Búsqueda en Sistemas de Etiquetado de Números de Bib Recopilados por Multitudes Usando Fusión de Datos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Computación en la nube
Procesamiento de información
Sistemas impulsados por la multitud
Errores humanos
Modelo de fusión de datos
Modelos gráficos probabilísticos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Hoy en día, la computación en la nube se aplica con éxito a muchos problemas de procesamiento de información en una variedad de dominios. Uno de los problemas más agudos con los sistemas impulsados por la multitud es la calidad de los resultados (ya que los humanos pueden cometer errores). Por lo tanto, se han propuesto una serie de métodos para procesar los resultados obtenidos de la multitud con el fin de compensar los errores humanos. La mayoría de los métodos existentes para procesar contribuciones se construyen sobre la suposición (natural) de que la única información disponible son datos poco fiables obtenidos de la multitud. Sin embargo, en algunos casos, hay información adicional disponible, y se puede utilizar para mejorar la calidad general del resultado. El artículo describe una aplicación de computación en la nube para la etiquetación comunitaria de fotos de carreras. Presenta un análisis de utilidad para identificar situaciones en las que la etiquetación comunitaria de fotos es una opción razonable. También propone un modelo de fusión de datos que utiliza la información de ubicación de los corredores registrada en sus rastros del Sistema de Posicionamiento Global (GPS). Los experimentos de campo con las aplicaciones muestran que la etiquetación basada en la comunidad puede reunir suficientes contribuyentes para procesar conjuntos de fotos de eventos de carreras de tamaño mediano. Los resultados de simulación confirman que el uso de la fusión de datos en el procesamiento de los resultados de la computación en la nube es una técnica prometedora, y el uso de modelos gráficos probabilísticos (por ejemplo, redes bayesianas) para la fusión de datos permite aumentar suavemente la calidad de los resultados con un aumento de la información disponible.
Descripción
Hoy en día, la computación en la nube se aplica con éxito a muchos problemas de procesamiento de información en una variedad de dominios. Uno de los problemas más agudos con los sistemas impulsados por la multitud es la calidad de los resultados (ya que los humanos pueden cometer errores). Por lo tanto, se han propuesto una serie de métodos para procesar los resultados obtenidos de la multitud con el fin de compensar los errores humanos. La mayoría de los métodos existentes para procesar contribuciones se construyen sobre la suposición (natural) de que la única información disponible son datos poco fiables obtenidos de la multitud. Sin embargo, en algunos casos, hay información adicional disponible, y se puede utilizar para mejorar la calidad general del resultado. El artículo describe una aplicación de computación en la nube para la etiquetación comunitaria de fotos de carreras. Presenta un análisis de utilidad para identificar situaciones en las que la etiquetación comunitaria de fotos es una opción razonable. También propone un modelo de fusión de datos que utiliza la información de ubicación de los corredores registrada en sus rastros del Sistema de Posicionamiento Global (GPS). Los experimentos de campo con las aplicaciones muestran que la etiquetación basada en la comunidad puede reunir suficientes contribuyentes para procesar conjuntos de fotos de eventos de carreras de tamaño mediano. Los resultados de simulación confirman que el uso de la fusión de datos en el procesamiento de los resultados de la computación en la nube es una técnica prometedora, y el uso de modelos gráficos probabilísticos (por ejemplo, redes bayesianas) para la fusión de datos permite aumentar suavemente la calidad de los resultados con un aumento de la información disponible.