Exploración y análisis de datos de noticias falsas
Autores: Awan, Mazhar Javed; Yasin, Awais; Nobanee, Haitham; Ali, Ahmed Abid; Shahzad, Zain; Nabeel, Muhammad; Zain, Azlan Mohd; Shahzad, Hafiz Muhammad Faisal
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Exploración y análisis de datos de noticias falsas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Internet
Noticias
Noticias falsas
Redes sociales
Aprendizaje automático
Modelos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 51
Citaciones: Sin citaciones
Antes de internet, las personas obtenían sus noticias de la radio, la televisión y los periódicos. Con internet, las noticias se trasladaron en línea, y de repente, cualquiera podía publicar información en sitios web como Facebook y Twitter. La propagación de noticias falsas también ha aumentado con las redes sociales. Se ha convertido en uno de los problemas más significativos de este siglo. Las personas utilizan el método de noticias falsas para dañar la reputación de una organización bien reputada en su beneficio. La razón más importante para tal proyecto es enmarcar un dispositivo para examinar los diseños de lenguaje que describen noticias falsas y verdaderas a través del aprendizaje automático. Este documento propone modelos de aprendizaje automático que pueden detectar con éxito noticias falsas. Estos modelos identifican qué noticias son reales o falsas y especifican la precisión de dichas noticias, incluso en un entorno complejo. Después de la preprocesamiento y exploración de datos, aplicamos tres modelos de aprendizaje automático; clasificador de bosques aleatorios, regresión logística y vectorizador de frecuencia de término-inverso de documento (TF-IDF). La precisión del vectorizador TFIDF, regresión logística, clasificador de bosques aleatorios y clasificador de árbol de decisión fue aproximadamente del 99.52%, 98.63%, 99.63% y 99.68%, respectivamente. Los modelos de aprendizaje automático pueden considerarse una excelente opción para encontrar resultados basados en la realidad y aplicarse a otros datos no estructurados para diversas aplicaciones de análisis de sentimientos.
Descripción
Antes de internet, las personas obtenían sus noticias de la radio, la televisión y los periódicos. Con internet, las noticias se trasladaron en línea, y de repente, cualquiera podía publicar información en sitios web como Facebook y Twitter. La propagación de noticias falsas también ha aumentado con las redes sociales. Se ha convertido en uno de los problemas más significativos de este siglo. Las personas utilizan el método de noticias falsas para dañar la reputación de una organización bien reputada en su beneficio. La razón más importante para tal proyecto es enmarcar un dispositivo para examinar los diseños de lenguaje que describen noticias falsas y verdaderas a través del aprendizaje automático. Este documento propone modelos de aprendizaje automático que pueden detectar con éxito noticias falsas. Estos modelos identifican qué noticias son reales o falsas y especifican la precisión de dichas noticias, incluso en un entorno complejo. Después de la preprocesamiento y exploración de datos, aplicamos tres modelos de aprendizaje automático; clasificador de bosques aleatorios, regresión logística y vectorizador de frecuencia de término-inverso de documento (TF-IDF). La precisión del vectorizador TFIDF, regresión logística, clasificador de bosques aleatorios y clasificador de árbol de decisión fue aproximadamente del 99.52%, 98.63%, 99.63% y 99.68%, respectivamente. Los modelos de aprendizaje automático pueden considerarse una excelente opción para encontrar resultados basados en la realidad y aplicarse a otros datos no estructurados para diversas aplicaciones de análisis de sentimientos.