¡todo está en la incrustación! detección de noticias falsas utilizando incrustaciones de documentos
Autores: Truic, Ciprian-Octavian; Apostol, Elena-Simona
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
¡todo está en la incrustación! detección de noticias falsas utilizando incrustaciones de documentos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Cambio
Redes sociales
Noticias falsas
Procesamiento del Lenguaje Natural
Aprendizaje Automático
Incrustaciones de documentos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Con el cambio actual en el panorama de los medios de comunicación de un rigor periodístico a las redes sociales, las redes sociales personalizadas se están convirtiendo en la nueva norma. Aunque el progreso de la digitalización de los medios trae muchas ventajas, también aumenta el riesgo de difundir desinformación, información errónea y deformación a través del uso de noticias falsas. La aparición de este fenómeno dañino ha logrado polarizar la sociedad y manipular la opinión pública sobre temas particulares, por ejemplo, elecciones, vacunas, etc. Dicha información propagada en las redes sociales puede distorsionar las percepciones públicas y generar malestar social mientras carece del rigor del periodismo tradicional. El Procesamiento del Lenguaje Natural y las técnicas de Aprendizaje Automático son esenciales para desarrollar herramientas eficientes que puedan detectar noticias falsas. Los modelos que utilizan el contexto de los datos textuales son esenciales para resolver el problema de detección de noticias falsas, ya que logran codificar características lingüísticas dentro de la representación vectorial de las palabras. En este documento, proponemos un nuevo enfoque que utiliza incrustaciones de documentos para construir múltiples modelos que etiquetan con precisión artículos de noticias como confiables o falsos. También presentamos un punto de referencia sobre diferentes arquitecturas que detectan noticias falsas utilizando clasificación binaria o multi-etiquetada. Evaluamos los modelos en cinco grandes corpora de noticias utilizando precisión, y recuperación. Obtuvimos mejores resultados que modelos más complejos de vanguardia de redes neuronales profundas. Observamos que el factor más importante para obtener una alta precisión es la codificación del documento, no la complejidad del modelo de clasificación.
Descripción
Con el cambio actual en el panorama de los medios de comunicación de un rigor periodístico a las redes sociales, las redes sociales personalizadas se están convirtiendo en la nueva norma. Aunque el progreso de la digitalización de los medios trae muchas ventajas, también aumenta el riesgo de difundir desinformación, información errónea y deformación a través del uso de noticias falsas. La aparición de este fenómeno dañino ha logrado polarizar la sociedad y manipular la opinión pública sobre temas particulares, por ejemplo, elecciones, vacunas, etc. Dicha información propagada en las redes sociales puede distorsionar las percepciones públicas y generar malestar social mientras carece del rigor del periodismo tradicional. El Procesamiento del Lenguaje Natural y las técnicas de Aprendizaje Automático son esenciales para desarrollar herramientas eficientes que puedan detectar noticias falsas. Los modelos que utilizan el contexto de los datos textuales son esenciales para resolver el problema de detección de noticias falsas, ya que logran codificar características lingüísticas dentro de la representación vectorial de las palabras. En este documento, proponemos un nuevo enfoque que utiliza incrustaciones de documentos para construir múltiples modelos que etiquetan con precisión artículos de noticias como confiables o falsos. También presentamos un punto de referencia sobre diferentes arquitecturas que detectan noticias falsas utilizando clasificación binaria o multi-etiquetada. Evaluamos los modelos en cinco grandes corpora de noticias utilizando precisión, y recuperación. Obtuvimos mejores resultados que modelos más complejos de vanguardia de redes neuronales profundas. Observamos que el factor más importante para obtener una alta precisión es la codificación del documento, no la complejidad del modelo de clasificación.