Mapeo geoespacial de la predicción de discursos de odio en urdu romano
Autores: Aziz, Samia; Sarfraz, Muhammad Shahzad; Usman, Muhammad; Aftab, Muhammad Umar; Rauf, Hafiz Tayyab
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mapeo geoespacial de la predicción de discursos de odio en urdu romano
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Medios sociales
Expresión política
Discurso de odio
Políticos
Opiniones públicas
Pakistán
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Las redes sociales se han transformado en un canal crucial para la expresión política. Twitter, en particular, es una plataforma vital utilizada para intercambiar odio político en Pakistán. El discurso de odio político afecta la imagen pública de los políticos, apunta a sus seguidores y hiere los sentimientos públicos. El discurso de odio es un discurso público controvertido que promueve la violencia hacia una persona o grupo basado en características específicas. Aunque se han realizado estudios para identificar el discurso de odio en idiomas europeos, los idiomas romanos aún no han recibido mucha atención. En este trabajo de investigación, presentamos la detección automática de discurso de odio político en Roman Urdu. Se ha desarrollado un conjunto de datos etiquetado exclusivo de discurso de odio político (RU-PHS) que contiene 5002 instancias e información a nivel de ciudad. Para superar la vasta estructura léxica del Roman Urdu, proponemos un algoritmo para la unificación léxica del Roman Urdu. Se desarrollan tres técnicas de vectorización: TF-IDF, word2vec y fastText. Se presenta un análisis comparativo de la precisión y la complejidad temporal de modelos de aprendizaje automático convencionales y redes neuronales afinadas utilizando representaciones de palabras densas para clasificar y predecir el discurso de odio político. Los resultados muestran que un bosque aleatorio y la red neuronal de alimentación propuesta logran una precisión del 93% utilizando la incrustación de palabras fastText para distinguir entre un discurso neutral y políticamente ofensivo. La información estadística ayuda a identificar tendencias y patrones, y el análisis de puntos calientes y de agrupamiento ayuda a señalar a Punjab como un área altamente susceptible en Pakistán en términos de generación de tuits de odio político.
Descripción
Las redes sociales se han transformado en un canal crucial para la expresión política. Twitter, en particular, es una plataforma vital utilizada para intercambiar odio político en Pakistán. El discurso de odio político afecta la imagen pública de los políticos, apunta a sus seguidores y hiere los sentimientos públicos. El discurso de odio es un discurso público controvertido que promueve la violencia hacia una persona o grupo basado en características específicas. Aunque se han realizado estudios para identificar el discurso de odio en idiomas europeos, los idiomas romanos aún no han recibido mucha atención. En este trabajo de investigación, presentamos la detección automática de discurso de odio político en Roman Urdu. Se ha desarrollado un conjunto de datos etiquetado exclusivo de discurso de odio político (RU-PHS) que contiene 5002 instancias e información a nivel de ciudad. Para superar la vasta estructura léxica del Roman Urdu, proponemos un algoritmo para la unificación léxica del Roman Urdu. Se desarrollan tres técnicas de vectorización: TF-IDF, word2vec y fastText. Se presenta un análisis comparativo de la precisión y la complejidad temporal de modelos de aprendizaje automático convencionales y redes neuronales afinadas utilizando representaciones de palabras densas para clasificar y predecir el discurso de odio político. Los resultados muestran que un bosque aleatorio y la red neuronal de alimentación propuesta logran una precisión del 93% utilizando la incrustación de palabras fastText para distinguir entre un discurso neutral y políticamente ofensivo. La información estadística ayuda a identificar tendencias y patrones, y el análisis de puntos calientes y de agrupamiento ayuda a señalar a Punjab como un área altamente susceptible en Pakistán en términos de generación de tuits de odio político.