Detección de discurso de odio multilingüe en línea: Experimentando con redes sociales en hindi e inglés
Autores: Vashistha, Neeraj; Zubiaga, Arkaitz
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Detección de discurso de odio multilingüe en línea: Experimentando con redes sociales en hindi e inglés
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aumento
Internet
Redes sociales
Detección de discurso de odio
Conjuntos de datos
Rendimiento del modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las últimas dos décadas han visto un aumento exponencial en el uso de Internet y las redes sociales, lo que ha cambiado la interacción humana básica. Esto ha llevado a muchos resultados positivos. Al mismo tiempo, ha traído riesgos y daños. El volumen de contenido dañino en línea, como el discurso de odio, no es manejable por humanos. El interés en la comunidad académica por investigar medios automatizados para la detección del discurso de odio ha aumentado. En este estudio, analizamos seis conjuntos de datos disponibles públicamente combinándolos en un solo conjunto de datos homogéneo. Tras clasificarlos en tres clases: abusivo, odioso o ninguno, creamos un modelo base y mejoramos las puntuaciones de rendimiento del modelo utilizando varias técnicas de optimización. Después de alcanzar una puntuación de rendimiento competitiva, creamos una herramienta que identifica y puntúa una página con una métrica efectiva en casi tiempo real y utiliza la misma retroalimentación para reentrenar nuestro modelo. Demostramos el rendimiento competitivo de nuestro modelo multilingüe en dos idiomas, inglés e hindi. Esto conduce a un rendimiento comparable o superior al de la mayoría de los modelos monolingües.
Descripción
Las últimas dos décadas han visto un aumento exponencial en el uso de Internet y las redes sociales, lo que ha cambiado la interacción humana básica. Esto ha llevado a muchos resultados positivos. Al mismo tiempo, ha traído riesgos y daños. El volumen de contenido dañino en línea, como el discurso de odio, no es manejable por humanos. El interés en la comunidad académica por investigar medios automatizados para la detección del discurso de odio ha aumentado. En este estudio, analizamos seis conjuntos de datos disponibles públicamente combinándolos en un solo conjunto de datos homogéneo. Tras clasificarlos en tres clases: abusivo, odioso o ninguno, creamos un modelo base y mejoramos las puntuaciones de rendimiento del modelo utilizando varias técnicas de optimización. Después de alcanzar una puntuación de rendimiento competitiva, creamos una herramienta que identifica y puntúa una página con una métrica efectiva en casi tiempo real y utiliza la misma retroalimentación para reentrenar nuestro modelo. Demostramos el rendimiento competitivo de nuestro modelo multilingüe en dos idiomas, inglés e hindi. Esto conduce a un rendimiento comparable o superior al de la mayoría de los modelos monolingües.