Detección de temas en microblogs chinos a través de la expansión semántica basada en POS
Autores: Ding, Lianhong; Sun, Bin; Shi, Peng
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Detección de temas en microblogs chinos a través de la expansión semántica basada en POS
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Redes sociales
Microblogging
Detección de temas
Descripción semántica
Microblogs chinos
Agrupamiento incremental
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Un microblog es un nuevo tipo de red social para la publicación, adquisición y difusión de información. Encontrar los temas significativos de un microblog es necesario para rastrear la popularidad y seguir la opinión pública. Este artículo propone un método para detectar temas en microblogs chinos. Dado que los métodos tradicionales mostraron un bajo rendimiento en textos cortos de un microblog, proponemos un método de detección de temas basado en la descripción semántica de la publicación del microblog. La expansión semántica de la publicación proporciona más información y pistas para la detección de temas. Primero, se extraen características semánticas de una publicación de microblog. En segundo lugar, las características semánticas se expanden de acuerdo con un tesauro. Aquí se utiliza TongYiCi CiLin como recurso léxico para encontrar palabras con el mismo significado. Para superar el problema de la polisemia, se introducen y comparan varias estrategias de expansión semántica basadas en la categoría gramatical. En tercer lugar, se presenta un enfoque para detectar temas basado en descripciones semánticas y un algoritmo de agrupamiento incremental mejorado. Se emplea un conjunto de datos de Sina Weibo para evaluar nuestro método. Los resultados experimentales muestran que nuestro método puede generar mejores resultados tanto para la agrupación de publicaciones como para la detección de temas en microblogs chinos. También encontramos que la expansión semántica de los sustantivos es mucho más eficiente que para otras partes del discurso. También se analiza y discute el mecanismo potencial del fenómeno.
Descripción
Un microblog es un nuevo tipo de red social para la publicación, adquisición y difusión de información. Encontrar los temas significativos de un microblog es necesario para rastrear la popularidad y seguir la opinión pública. Este artículo propone un método para detectar temas en microblogs chinos. Dado que los métodos tradicionales mostraron un bajo rendimiento en textos cortos de un microblog, proponemos un método de detección de temas basado en la descripción semántica de la publicación del microblog. La expansión semántica de la publicación proporciona más información y pistas para la detección de temas. Primero, se extraen características semánticas de una publicación de microblog. En segundo lugar, las características semánticas se expanden de acuerdo con un tesauro. Aquí se utiliza TongYiCi CiLin como recurso léxico para encontrar palabras con el mismo significado. Para superar el problema de la polisemia, se introducen y comparan varias estrategias de expansión semántica basadas en la categoría gramatical. En tercer lugar, se presenta un enfoque para detectar temas basado en descripciones semánticas y un algoritmo de agrupamiento incremental mejorado. Se emplea un conjunto de datos de Sina Weibo para evaluar nuestro método. Los resultados experimentales muestran que nuestro método puede generar mejores resultados tanto para la agrupación de publicaciones como para la detección de temas en microblogs chinos. También encontramos que la expansión semántica de los sustantivos es mucho más eficiente que para otras partes del discurso. También se analiza y discute el mecanismo potencial del fenómeno.