Detección de ciberacoso en redes sociales utilizando aprendizaje por apilamiento y BERT mejorado
Autores: Muneer, Amgad; Alwadain, Ayed; Ragab, Mohammed Gamal; Alqushaibi, Alawi
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de ciberacoso en redes sociales utilizando aprendizaje por apilamiento y BERT mejorado
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Ciberacoso
Redes sociales
Aprendizaje en conjunto
Twitter
BERT-M
Detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La prevalencia del ciberacoso en las plataformas de redes sociales (SM) se ha convertido en una preocupación significativa para individuos, organizaciones y la sociedad en su conjunto. La detección temprana e intervención del ciberacoso en las redes sociales son críticas para mitigar sus efectos dañinos. En los últimos años, el aprendizaje en conjunto ha mostrado resultados prometedores para detectar ciberacoso en las redes sociales. Este documento presenta un enfoque de aprendizaje por apilamiento en conjunto para detectar ciberacoso en Twitter utilizando una combinación de métodos de Redes Neuronales Profundas (DNNs). También introduce BERT-M, un modelo BERT modificado. El conjunto de datos utilizado en este estudio fue recopilado de Twitter y preprocesado para eliminar información irrelevante. El proceso de extracción de características involucró la utilización de word2vec con Continuous Bag of Words (CBOW) para formar los pesos en la capa de incrustación. Estas características fueron luego alimentadas a un mecanismo de convolución y agrupamiento, reduciendo efectivamente su dimensionalidad y capturando las características invariantes de posición de las palabras ofensivas. La validación del modelo apilado propuesto y BERT-M se realizó utilizando medidas de evaluación de modelos bien conocidas. El modelo apilado logró un F1-score de 0.964, una precisión de 0.950, un recall de 0.92 y el tiempo de detección reportado fue de 3 minutos, lo que supera la precisión y velocidad previamente reportadas para todos los detectores de ciberacoso conocidos en PLN, incluyendo el BERT estándar y BERT-M. Los resultados del experimento mostraron que el enfoque de aprendizaje por apilamiento en conjunto logró una precisión del 97.4% en la detección de ciberacoso en el conjunto de datos de Twitter y del 90.97% en el conjunto de datos combinado de Twitter y Facebook. Los resultados demuestran la efectividad del enfoque de aprendizaje por apilamiento en conjunto propuesto en la detección de ciberacoso en SM y destacan la importancia de combinar múltiples modelos para mejorar el rendimiento.
Descripción
La prevalencia del ciberacoso en las plataformas de redes sociales (SM) se ha convertido en una preocupación significativa para individuos, organizaciones y la sociedad en su conjunto. La detección temprana e intervención del ciberacoso en las redes sociales son críticas para mitigar sus efectos dañinos. En los últimos años, el aprendizaje en conjunto ha mostrado resultados prometedores para detectar ciberacoso en las redes sociales. Este documento presenta un enfoque de aprendizaje por apilamiento en conjunto para detectar ciberacoso en Twitter utilizando una combinación de métodos de Redes Neuronales Profundas (DNNs). También introduce BERT-M, un modelo BERT modificado. El conjunto de datos utilizado en este estudio fue recopilado de Twitter y preprocesado para eliminar información irrelevante. El proceso de extracción de características involucró la utilización de word2vec con Continuous Bag of Words (CBOW) para formar los pesos en la capa de incrustación. Estas características fueron luego alimentadas a un mecanismo de convolución y agrupamiento, reduciendo efectivamente su dimensionalidad y capturando las características invariantes de posición de las palabras ofensivas. La validación del modelo apilado propuesto y BERT-M se realizó utilizando medidas de evaluación de modelos bien conocidas. El modelo apilado logró un F1-score de 0.964, una precisión de 0.950, un recall de 0.92 y el tiempo de detección reportado fue de 3 minutos, lo que supera la precisión y velocidad previamente reportadas para todos los detectores de ciberacoso conocidos en PLN, incluyendo el BERT estándar y BERT-M. Los resultados del experimento mostraron que el enfoque de aprendizaje por apilamiento en conjunto logró una precisión del 97.4% en la detección de ciberacoso en el conjunto de datos de Twitter y del 90.97% en el conjunto de datos combinado de Twitter y Facebook. Los resultados demuestran la efectividad del enfoque de aprendizaje por apilamiento en conjunto propuesto en la detección de ciberacoso en SM y destacan la importancia de combinar múltiples modelos para mejorar el rendimiento.