Detección de Ofensivas en Árabe y Discurso de Odio Usando un Modelo de Aprendizaje Multi-Tarea de Cruce de Corpora
Autores: Aldjanabi, Wassen; Dahou, Abdelghani; Al-qaness, Mohammed A. A.; Elaziz, Mohamed Abd; Helmi, Ahmed Mohamed; Damaeviius, Robertas
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de Ofensivas en Árabe y Discurso de Odio Usando un Modelo de Aprendizaje Multi-Tarea de Cruce de Corpora
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Plataformas de redes sociales
Expresión de opiniones
Odio
Lenguaje ofensivo
Racismo
Violencia verbal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
A medida que las plataformas de redes sociales ofrecen un medio para la expresión de opiniones, fenómenos sociales como el odio, el lenguaje ofensivo, el racismo y todas las formas de violencia verbal han aumentado de manera espectacular. Estos comportamientos no afectan solo a países, grupos o comunidades específicos, sino que se extienden más allá de estas áreas a la vida cotidiana de las personas. Este estudio investiga el discurso ofensivo y de odio en las redes sociales árabes para construir un sistema de detección preciso de discurso ofensivo y de odio. Más precisamente, desarrollamos un sistema de clasificación para determinar el discurso ofensivo y de odio utilizando un modelo de aprendizaje multitarea (MTL) construido sobre un modelo de lenguaje árabe preentrenado. Entrenamos el modelo MTL en la misma tarea utilizando corpus cruzados que representan una variación en el contexto ofensivo y de odio para aprender representaciones contextuales globales y específicas del conjunto de datos. El modelo MTL desarrollado mostró un rendimiento significativo y superó a los modelos existentes en la literatura en tres de cuatro conjuntos de datos para tareas de detección de discurso ofensivo y de odio en árabe.
Descripción
A medida que las plataformas de redes sociales ofrecen un medio para la expresión de opiniones, fenómenos sociales como el odio, el lenguaje ofensivo, el racismo y todas las formas de violencia verbal han aumentado de manera espectacular. Estos comportamientos no afectan solo a países, grupos o comunidades específicos, sino que se extienden más allá de estas áreas a la vida cotidiana de las personas. Este estudio investiga el discurso ofensivo y de odio en las redes sociales árabes para construir un sistema de detección preciso de discurso ofensivo y de odio. Más precisamente, desarrollamos un sistema de clasificación para determinar el discurso ofensivo y de odio utilizando un modelo de aprendizaje multitarea (MTL) construido sobre un modelo de lenguaje árabe preentrenado. Entrenamos el modelo MTL en la misma tarea utilizando corpus cruzados que representan una variación en el contexto ofensivo y de odio para aprender representaciones contextuales globales y específicas del conjunto de datos. El modelo MTL desarrollado mostró un rendimiento significativo y superó a los modelos existentes en la literatura en tres de cuatro conjuntos de datos para tareas de detección de discurso ofensivo y de odio en árabe.