Incremental clustering de informes de noticias
Autores: Azzopardi, Joel; Staff, Christopher
Idioma: Inglés
Editor: MDPI
Año: 2012
Acceso abierto
Artículo científico
2012
Incremental clustering de informes de noticias
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Evento
Informes de noticias
Sistema de agrupamiento
Fuente RSS
Entorno incremental en línea
Agrupamiento detallado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 50
Citaciones: Sin citaciones
Cuando ocurre un evento en el mundo real, numerosos informes de noticias que describen este evento comienzan a aparecer en diferentes sitios de noticias dentro de unos pocos minutos de la ocurrencia del evento. Esto puede resultar en una gran cantidad de información para los usuarios, y pueden ser necesarios procesos automatizados para ayudar a gestionar esta información. En este documento, describimos un sistema de agrupamiento que puede agrupar informes de noticias de fuentes dispares en grupos centrados en eventos, grupos de informes de noticias que describen el mismo evento. Un usuario puede identificar cualquier fuente RSS como una fuente de noticias que le gustaría recibir y nuestro sistema de agrupamiento puede agrupar informes recibidos de las fuentes RSS separadas a medida que llegan sin conocer el número de grupos de antemano. Nuestro sistema de agrupamiento fue diseñado para funcionar bien en un entorno incremental en línea. Al evaluar nuestro sistema, encontramos que nuestro sistema es muy bueno para realizar agrupamientos detallados, pero tiene un rendimiento bastante pobre al realizar agrupamientos más generales.
Descripción
Cuando ocurre un evento en el mundo real, numerosos informes de noticias que describen este evento comienzan a aparecer en diferentes sitios de noticias dentro de unos pocos minutos de la ocurrencia del evento. Esto puede resultar en una gran cantidad de información para los usuarios, y pueden ser necesarios procesos automatizados para ayudar a gestionar esta información. En este documento, describimos un sistema de agrupamiento que puede agrupar informes de noticias de fuentes dispares en grupos centrados en eventos, grupos de informes de noticias que describen el mismo evento. Un usuario puede identificar cualquier fuente RSS como una fuente de noticias que le gustaría recibir y nuestro sistema de agrupamiento puede agrupar informes recibidos de las fuentes RSS separadas a medida que llegan sin conocer el número de grupos de antemano. Nuestro sistema de agrupamiento fue diseñado para funcionar bien en un entorno incremental en línea. Al evaluar nuestro sistema, encontramos que nuestro sistema es muy bueno para realizar agrupamientos detallados, pero tiene un rendimiento bastante pobre al realizar agrupamientos más generales.