Detección de Temas Basada en la Comunidad con Resolución Variable
Autores: Hamm, Andreas; Odrowski, Simon
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de Temas Basada en la Comunidad con Resolución Variable
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Red
Detección de temas
Detección de comunidades
Clasificación de términos
Incrustación de palabras
Parámetro de resolución
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los procedimientos basados en redes para la detección de temas en grandes colecciones de texto ofrecen una alternativa intuitiva a los modelos de temas probabilísticos. Presentamos en detalle un método que está especialmente diseñado teniendo en cuenta los requisitos de los expertos en la materia. Al igual que métodos similares, emplea la detección de comunidades en gráficos de co-ocurrencia de términos, pero se mejora al incluir un parámetro de resolución que se puede utilizar para cambiar la granularidad del tema objetivo. También establecemos un ranking de términos y utilizamos incrustaciones semánticas de palabras para presentar comunidades de términos de una manera que facilite su interpretación. Demostramos la aplicación de nuestro método con un corpus ampliamente utilizado de artículos de noticias generales y mostramos los resultados de evaluaciones detalladas de expertos en ciencias sociales sobre los temas detectados en varias resoluciones. También se incluye una comparación con los temas detectados por la Asignación de Dirichlet Latente. Finalmente, discutimos los factores que influyen en la interpretación de los temas.
Descripción
Los procedimientos basados en redes para la detección de temas en grandes colecciones de texto ofrecen una alternativa intuitiva a los modelos de temas probabilísticos. Presentamos en detalle un método que está especialmente diseñado teniendo en cuenta los requisitos de los expertos en la materia. Al igual que métodos similares, emplea la detección de comunidades en gráficos de co-ocurrencia de términos, pero se mejora al incluir un parámetro de resolución que se puede utilizar para cambiar la granularidad del tema objetivo. También establecemos un ranking de términos y utilizamos incrustaciones semánticas de palabras para presentar comunidades de términos de una manera que facilite su interpretación. Demostramos la aplicación de nuestro método con un corpus ampliamente utilizado de artículos de noticias generales y mostramos los resultados de evaluaciones detalladas de expertos en ciencias sociales sobre los temas detectados en varias resoluciones. También se incluye una comparación con los temas detectados por la Asignación de Dirichlet Latente. Finalmente, discutimos los factores que influyen en la interpretación de los temas.