Híbrido RFSVM: Hibridación de modelos SVM y Random Forest para la detección de noticias falsas
Autores: Dev, Deepali Goyal; Bhatnagar, Vishal
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Híbrido RFSVM: Hibridación de modelos SVM y Random Forest para la detección de noticias falsas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Creación
Difusión
Información falsa
Comunidad en internet
Noticias falsas
Algoritmos de aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La creación y difusión de información falsa puede llevarse a cabo muy fácilmente a través de la comunidad en internet. Esta escalada generalizada de noticias falsas y rumores tiene un efecto extremadamente adverso en la nación y la sociedad. La detección de noticias falsas en la web social es un tema emergente en la investigación actual. En esta investigación, los autores revisan varias características de las noticias falsas e identifican brechas en la investigación. En esta investigación, el conjunto de datos de noticias falsas se modela y tokeniza aplicando la frecuencia de términos y la frecuencia inversa de documentos (TFIDF). Se utilizan varios enfoques de clasificación de aprendizaje automático para calcular métricas de evaluación. Los autores proponen la hibridación de los algoritmos de clasificación SVM y RF para mejorar la precisión, la recuperación y la puntuación F1. Los autores también muestran el análisis comparativo de diferentes tipos de categorías de noticias utilizando varios modelos de aprendizaje automático y comparan el rendimiento del híbrido RFSVM. Los estudios comparativos de RFSVM híbrido con diferentes algoritmos como Random Forest (RF), naive Bayes (NB), SVM y XGBoost han mostrado mejores resultados de alrededor del 8% al 16% en términos de precisión, recuperación y puntuación F1.
Descripción
La creación y difusión de información falsa puede llevarse a cabo muy fácilmente a través de la comunidad en internet. Esta escalada generalizada de noticias falsas y rumores tiene un efecto extremadamente adverso en la nación y la sociedad. La detección de noticias falsas en la web social es un tema emergente en la investigación actual. En esta investigación, los autores revisan varias características de las noticias falsas e identifican brechas en la investigación. En esta investigación, el conjunto de datos de noticias falsas se modela y tokeniza aplicando la frecuencia de términos y la frecuencia inversa de documentos (TFIDF). Se utilizan varios enfoques de clasificación de aprendizaje automático para calcular métricas de evaluación. Los autores proponen la hibridación de los algoritmos de clasificación SVM y RF para mejorar la precisión, la recuperación y la puntuación F1. Los autores también muestran el análisis comparativo de diferentes tipos de categorías de noticias utilizando varios modelos de aprendizaje automático y comparan el rendimiento del híbrido RFSVM. Los estudios comparativos de RFSVM híbrido con diferentes algoritmos como Random Forest (RF), naive Bayes (NB), SVM y XGBoost han mostrado mejores resultados de alrededor del 8% al 16% en términos de precisión, recuperación y puntuación F1.