Incrustaciones de oraciones y extracción semántica de entidades para la identificación de temas de afirmaciones breves verificadas
Autores: Wcel, Krzysztof; Sawinski, Marcin; Lewoniewski, Wodzimierz; Stróyna, Milena; Ksiniak, Ewelina; Abramowicz, Witold
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Incrustaciones de oraciones y extracción semántica de entidades para la identificación de temas de afirmaciones breves verificadas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Investigación
Método
Temas
Verificación de hechos
Entidades semánticas
Verificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El objetivo de esta investigación fue diseñar un método para asignar temas a las afirmaciones desmentidas por agencias de verificación de hechos. Durante el proceso de verificación de hechos, es necesario acceder a un conocimiento más estructurado; por lo tanto, nuestro objetivo es describir los temas con vocabulario semántico. La clasificación de temas debe ir más allá de connotaciones simples como instancia-clase y reflejar fenómenos más amplios que son reconocidos por los verificadores de hechos. La asignación de entidades semánticas también es crucial para la verificación automática de hechos utilizando los gráficos de conocimiento subyacentes. Nuestro método se basa en incrustaciones de oraciones, varios métodos de agrupamiento (HDBSCAN, UMAP, K-means), coincidencia de entidades semánticas y evaluación de la importancia de términos basada en TF-IDF. Representamos nuestros temas en el espacio semántico utilizando Q-ids de Wikidata, DBpedia, temas de Wikipedia, YAGO y otras ontologías relevantes. Tal enfoque basado en entidades semánticas también apoya la navegación jerárquica dentro de los temas. Para la evaluación, comparamos los resultados de modelado de temas con afirmaciones ya etiquetadas por verificadores de hechos. El trabajo presentado en este artículo es útil para investigadores y profesionales interesados en el modelado semántico de temas de narrativas de noticias falsas.
Descripción
El objetivo de esta investigación fue diseñar un método para asignar temas a las afirmaciones desmentidas por agencias de verificación de hechos. Durante el proceso de verificación de hechos, es necesario acceder a un conocimiento más estructurado; por lo tanto, nuestro objetivo es describir los temas con vocabulario semántico. La clasificación de temas debe ir más allá de connotaciones simples como instancia-clase y reflejar fenómenos más amplios que son reconocidos por los verificadores de hechos. La asignación de entidades semánticas también es crucial para la verificación automática de hechos utilizando los gráficos de conocimiento subyacentes. Nuestro método se basa en incrustaciones de oraciones, varios métodos de agrupamiento (HDBSCAN, UMAP, K-means), coincidencia de entidades semánticas y evaluación de la importancia de términos basada en TF-IDF. Representamos nuestros temas en el espacio semántico utilizando Q-ids de Wikidata, DBpedia, temas de Wikipedia, YAGO y otras ontologías relevantes. Tal enfoque basado en entidades semánticas también apoya la navegación jerárquica dentro de los temas. Para la evaluación, comparamos los resultados de modelado de temas con afirmaciones ya etiquetadas por verificadores de hechos. El trabajo presentado en este artículo es útil para investigadores y profesionales interesados en el modelado semántico de temas de narrativas de noticias falsas.