logo móvil
Contáctanos

Detección de noticias falsas estilométricas basada en procesamiento de lenguaje natural utilizando reconocimiento de entidades nombradas: análisis dentro y fuera del dominio

Autores: Tsai, Chih-Ming

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Detección de noticias falsas estilométricas basada en procesamiento de lenguaje natural utilizando reconocimiento de entidades nombradas: análisis dentro y fuera del dominio


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Diseminación de información de noticias
Detección de noticias falsas
Procesamiento de lenguaje natural
Modelo NER-SA
Reconocimiento de entidades nombradas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 53

Citaciones: Sin citaciones


Descripción
Hoy en día, la difusión de información noticiosa se ha vuelto más rápida, liberal y abierta al público. La gente puede encontrar lo que quiere saber cada vez más fácilmente desde una variedad de fuentes, incluidos los medios de comunicación tradicionales y las nuevas plataformas de redes sociales. Sin embargo, en un momento en el que nuestras vidas están saturadas de todo tipo de noticias, no podemos evitar dudar de la veracidad y legitimidad de estas fuentes de noticias; al mismo tiempo, también necesitamos protegernos contra el posible impacto de diversas formas de noticias falsas. Para combatir la propagación de desinformación, cada vez más investigadores han recurrido a enfoques de procesamiento del lenguaje natural (NLP) para una detección efectiva de noticias falsas. Sin embargo, ante eventos de noticias falsas cada vez más graves, los métodos de detección existentes aún necesitan ser continuamente mejorados. Este estudio propone un modelo de concepto modificado llamado NER-SA, que integra el procesamiento del lenguaje natural (NLP) y el reconocimiento de entidades nombradas (NER) para realizar el análisis de detección de noticias falsas en el dominio y entre dominios con los tres conjuntos de datos existentes simultáneamente. Las entidades nombradas asociadas con cualquier evento de noticias en particular existen en un conjunto finito y disponible de evidencia. Por lo tanto, las entidades deben ser mencionadas y reconocidas en este banco de entidades en cualquier artículo de noticias auténtico. Una noticia falsa inevitablemente incluye solo algunos derechos en el banco de entidades. La información falsa está deliberadamente fabricada con frases y contenido ficticios, imaginarios e incluso irracionales. Como resultado, deben existir diferencias en las declaraciones, la lógica de escritura y el estilo entre las noticias legítimas y las noticias falsas, lo que significa que es posible detectar con éxito las noticias falsas. Desarrollamos un modelo matemático y utilizamos el algoritmo de recocido simulado para encontrar el área legítima óptima. Al comparar el rendimiento de detección del modelo NER-SA con los modelos propuestos en otros estudios que son de última generación, encontramos que el modelo NER-SA tiene un rendimiento superior en la detección de noticias falsas. Para el análisis en el dominio, la precisión aumentó en un promedio del 8,94% en el conjunto de datos y un 19,36% en el conjunto de datos, mientras que la puntuación F1 aumentó en un promedio del 24,04% en el conjunto de datos y un 19,36% en el conjunto de datos. En el análisis entre dominios, la precisión y la puntuación F1 del modelo NER-SA aumentaron en un promedio del 28,51% y 24,54%, respectivamente, en seis dominios en el conjunto de datos. Los hallazgos e implicaciones de este estudio se discuten más a fondo en lo que respecta a su importancia para mejorar la precisión, comprender el contexto y abordar los ataques adversarios. El desarrollo de la detección estilométrica basada en enfoques de NLP utilizando técnicas de NER puede mejorar la efectividad y aplicabilidad de la detección de noticias falsas.

Otros recursos que podrían interesarte

Temas Virtualpro