Detección de lenguaje racista en tweets en francés
Autores: Vanetik, Natalia; Mimoun, Elisheva
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección de lenguaje racista en tweets en francés
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Contenido tóxico en línea
Discurso de odio
Comunidades migrantes
Detección de discurso racista
Conjunto de datos francés
Detección automatizada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El contenido tóxico en línea se ha convertido en un problema importante en los últimos años debido al aumento exponencial en el uso de internet. En Francia, ha habido un aumento significativo en el discurso de odio contra las comunidades migrantes y musulmanas tras eventos como la salida del Reino Unido de la UE, los ataques de Charlie Hebdo y los ataques del Bataclan. Por lo tanto, la detección automatizada de lenguaje ofensivo y racismo está en alta demanda y representa un desafío serio. Desafortunadamente, hay menos conjuntos de datos anotados para el discurso racista que para el discurso de odio general disponibles, especialmente para el francés. Este artículo intenta cerrar esta brecha al (1) proponer y evaluar un nuevo conjunto de datos destinado a la detección automatizada del discurso racista en francés; (2) realizar un estudio de caso con múltiples modelos supervisados y representaciones de texto para la tarea de detección de lenguaje racista en francés; y (3) realizar experimentos multilingües.
Descripción
El contenido tóxico en línea se ha convertido en un problema importante en los últimos años debido al aumento exponencial en el uso de internet. En Francia, ha habido un aumento significativo en el discurso de odio contra las comunidades migrantes y musulmanas tras eventos como la salida del Reino Unido de la UE, los ataques de Charlie Hebdo y los ataques del Bataclan. Por lo tanto, la detección automatizada de lenguaje ofensivo y racismo está en alta demanda y representa un desafío serio. Desafortunadamente, hay menos conjuntos de datos anotados para el discurso racista que para el discurso de odio general disponibles, especialmente para el francés. Este artículo intenta cerrar esta brecha al (1) proponer y evaluar un nuevo conjunto de datos destinado a la detección automatizada del discurso racista en francés; (2) realizar un estudio de caso con múltiples modelos supervisados y representaciones de texto para la tarea de detección de lenguaje racista en francés; y (3) realizar experimentos multilingües.