Clasificación de toxicidad en redes sociales utilizando aprendizaje profundo: aplicación en el mundo real Brexit del Reino Unido
Autores: Fan, Hong; Du, Wu; Dahou, Abdelghani; Ewees, Ahmed A.; Yousri, Dalia; Elaziz, Mohamed Abd; Elsheikh, Ammar H.; Abualigah, Laith; Al-qaness, Mohammed A. A.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Clasificación de toxicidad en redes sociales utilizando aprendizaje profundo: aplicación en el mundo real Brexit del Reino Unido
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Medios sociales
Adicción
Toxicidad
Discurso de odio
Troleo
BERT
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Las redes sociales se han convertido en un aspecto esencial de la sociedad moderna, donde las personas comparten sus opiniones sobre una amplia variedad de temas. Las plataformas de redes sociales, como Twitter, han demostrado a lo largo de los años el valor que proporcionan al conectar a personas de todo el mundo con diferentes antecedentes. Sin embargo, también han mostrado efectos secundarios perjudiciales que pueden tener consecuencias graves. Uno de estos efectos secundarios perjudiciales de las redes sociales es la inmensa toxicidad que se puede encontrar en diversas discusiones. La palabra tóxica se ha vuelto sinónimo de discurso de odio en línea, troleo en internet y a veces cultura de la indignación. En este estudio, construimos un modelo eficiente para detectar y clasificar la toxicidad en las redes sociales a partir de contenido generado por el usuario utilizando el modelo BERT (Bidirectional Encoder Representations from Transformers). El modelo BERT preentrenado y tres de sus variantes se han ajustado en un conocido conjunto de datos etiquetado de comentarios tóxicos, el conjunto de datos público de Kaggle (Toxic Comment Classification Challenge). Además, probamos los modelos propuestos con dos conjuntos de datos recopilados de Twitter de dos períodos diferentes para detectar la toxicidad en el contenido generado por el usuario (tweets) utilizando hashtags pertenecientes al Brexit del Reino Unido. Los resultados mostraron que el modelo propuesto puede clasificar y analizar eficientemente tweets tóxicos.
Descripción
Las redes sociales se han convertido en un aspecto esencial de la sociedad moderna, donde las personas comparten sus opiniones sobre una amplia variedad de temas. Las plataformas de redes sociales, como Twitter, han demostrado a lo largo de los años el valor que proporcionan al conectar a personas de todo el mundo con diferentes antecedentes. Sin embargo, también han mostrado efectos secundarios perjudiciales que pueden tener consecuencias graves. Uno de estos efectos secundarios perjudiciales de las redes sociales es la inmensa toxicidad que se puede encontrar en diversas discusiones. La palabra tóxica se ha vuelto sinónimo de discurso de odio en línea, troleo en internet y a veces cultura de la indignación. En este estudio, construimos un modelo eficiente para detectar y clasificar la toxicidad en las redes sociales a partir de contenido generado por el usuario utilizando el modelo BERT (Bidirectional Encoder Representations from Transformers). El modelo BERT preentrenado y tres de sus variantes se han ajustado en un conocido conjunto de datos etiquetado de comentarios tóxicos, el conjunto de datos público de Kaggle (Toxic Comment Classification Challenge). Además, probamos los modelos propuestos con dos conjuntos de datos recopilados de Twitter de dos períodos diferentes para detectar la toxicidad en el contenido generado por el usuario (tweets) utilizando hashtags pertenecientes al Brexit del Reino Unido. Los resultados mostraron que el modelo propuesto puede clasificar y analizar eficientemente tweets tóxicos.