logo móvil
Contáctanos

Desbalanceo Multi-Clase en la Clasificación de Texto: Un Enfoque de Ingeniería de Características para Detectar Ciberacoso en Twitter

Autores: Talpur, Bandeh Ali; O"Sullivan, Declan

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Desbalanceo Multi-Clase en la Clasificación de Texto: Un Enfoque de Ingeniería de Características para Detectar Ciberacoso en Twitter


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Twitter
Ciberacoso
Modelo
Gravedad
Características
Clasificación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Twitter permite a millones de usuarios activos enviar y leer mensajes concisos en internet todos los días. Sin embargo, algunas personas utilizan Twitter para propagar mensajes violentos y amenazantes, lo que resulta en ciberacoso. Investigaciones anteriores se han centrado en si el comportamiento de ciberacoso existe o no en un tweet (clasificación binaria). En esta investigación, desarrollamos un modelo para detectar la gravedad del ciberacoso en un tweet. El modelo desarrollado es un modelo basado en características que utiliza características del contenido de un tweet para desarrollar un clasificador de aprendizaje automático que clasifica los tweets como no ciberacosados, y tweets de ciberacoso de bajo, medio o alto nivel. En este estudio, introdujimos la orientación semántica puntual como una nueva característica de entrada junto con la utilización de características predichas (género, edad y tipo de personalidad) y características de la API de Twitter. Los resultados de los experimentos con nuestro marco propuesto en un entorno de múltiples clases son prometedores tanto en lo que respecta a Kappa (84%), precisión del clasificador (93%) y la métrica F-medida (92%). En general, el 40% de los clasificadores aumentaron su rendimiento en comparación con enfoques de referencia. Nuestro análisis muestra que las características con la mayor razón de probabilidades para detectar gravedad de bajo nivel incluyen: grupo de edad entre 19-22 años y usuarios con menos de 1 año de activación de cuenta de Twitter; para gravedad de nivel medio: neuroticismo, grupo de edad entre 23-29 años y ser un usuario de Twitter entre uno y dos años; y para gravedad de alto nivel: neuroticismo y extraversión, y el número de veces que un tweet ha sido marcado como favorito por otros usuarios. Creemos que esta investigación utilizando un enfoque de clasificación de múltiples clases proporciona un avance en la identificación de la gravedad en diferentes niveles (bajo, medio, alto) cuando el contenido de un tweet se clasifica como ciberacoso. Por último, el estudio actual se centró únicamente en la plataforma de Twitter; otras plataformas de redes sociales pueden ser investigadas utilizando el mismo enfoque para detectar patrones de gravedad de ciberacoso.

Otros recursos que podrían interesarte

Temas Virtualpro