Un marco formal unificado para modelado de temas factorial y probabilístico
Autores: Gibert, Karina; Hernandez-Potiomkin, Yaroslav
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un marco formal unificado para modelado de temas factorial y probabilístico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelado de temas
Extracción de conocimiento
Métodos factoriales
Métodos probabilísticos
Métodos de procesamiento de lenguaje natural
Marco conceptual unificado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La modelización de temas se ha convertido en una técnica muy popular para extraer conocimiento de textos. Engloba diversas familias de métodos, incluyendo métodos factoriales, métodos probabilísticos y métodos de procesamiento de lenguaje natural. Este artículo introduce un marco conceptual unificado para los métodos factoriales y probabilísticos mediante la identificación de elementos compartidos y representándolos utilizando una notación homogénea. El artículo presenta 12 métodos diferentes dentro de este marco, permitiendo un análisis comparativo fácil para evaluar la flexibilidad y la realismo de las suposiciones de cada enfoque. Esto establece la etapa inicial de un análisis más amplio destinado a relacionar todas las familias de métodos con este marco común, comprendiendo exhaustivamente sus fortalezas y debilidades, y estableciendo pautas generales de aplicación. Además, una configuración experimental refuerza la conveniencia de tener un esquema de notación armonizado. El artículo concluye con una discusión sobre los métodos presentados y esboza futuras direcciones de investigación.
Descripción
La modelización de temas se ha convertido en una técnica muy popular para extraer conocimiento de textos. Engloba diversas familias de métodos, incluyendo métodos factoriales, métodos probabilísticos y métodos de procesamiento de lenguaje natural. Este artículo introduce un marco conceptual unificado para los métodos factoriales y probabilísticos mediante la identificación de elementos compartidos y representándolos utilizando una notación homogénea. El artículo presenta 12 métodos diferentes dentro de este marco, permitiendo un análisis comparativo fácil para evaluar la flexibilidad y la realismo de las suposiciones de cada enfoque. Esto establece la etapa inicial de un análisis más amplio destinado a relacionar todas las familias de métodos con este marco común, comprendiendo exhaustivamente sus fortalezas y debilidades, y estableciendo pautas generales de aplicación. Además, una configuración experimental refuerza la conveniencia de tener un esquema de notación armonizado. El artículo concluye con una discusión sobre los métodos presentados y esboza futuras direcciones de investigación.