logo móvil
Contáctanos

La detección de eventos en el historial de edición de Wikipedia se mejora mediante la evaluación automática basada en documentos web

Autores: Fisichella, Marco; Ceroni, Andrea

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

La detección de eventos en el historial de edición de Wikipedia se mejora mediante la evaluación automática basada en documentos web


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Mayoría
Relaciones
Wikipedia
Eventos
Evolución
Validación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 54

Citaciones: Sin citaciones


Descripción
La mayoría del trabajo actual en la extracción de eventos asume la naturaleza estática de las relaciones en bases de conocimiento de expertos constantes. Sin embargo, en entornos colaborativos, como Wikipedia, la información y los sistemas son extraordinariamente dinámicos con el tiempo. En este trabajo, presentamos un nuevo enfoque para extraer estructuras complejas de eventos de Wikipedia. Abogamos por un nuevo modelo para representar eventos involucrando a más de una entidad que sea generalizable a un lenguaje arbitrario. La evolución de un evento se captura con éxito principalmente basándose en el análisis de los registros de ediciones de usuarios en Wikipedia. Nuestro trabajo presenta una base para una clase singular de algoritmos de enriquecimiento basados en entidades conscientes de la evolución y aumentará ampliamente la calidad de accesibilidad de entidades y recuperación temporal para Wikipedia. Formalizamos este caso de problema y realizamos experimentos exhaustivos en un conjunto de datos reales de 1.8 millones de artículos de Wikipedia para mostrar la efectividad de nuestra respuesta propuesta. Además, sugerimos un nuevo método automático de validación de eventos que depende de un modelo supervisado para predecir la presencia de eventos en un corpus no anotado. Como fuente de documento adicional para la validación de eventos, elegimos la Web debido a su facilidad de accesibilidad y amplia cobertura de eventos. Nuestros resultados muestran que somos capaces de obtener una precisión del 70% evaluada en un corpus anotado manualmente. Finalmente, realizamos una comparación de nuestra estrategia versus la de Wikipedia y descubrimos que nuestro WikipEvent propuesto junto con el uso de la técnica de co-referencias se puede utilizar para proporcionar datos nuevos y más información sobre eventos.

Otros recursos que podrían interesarte

Temas Virtualpro