logo móvil
Contáctanos

Mapeo geoespacial de la predicción de discursos de odio en urdu romano

Autores: Aziz, Samia; Sarfraz, Muhammad Shahzad; Usman, Muhammad; Aftab, Muhammad Umar; Rauf, Hafiz Tayyab

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Mapeo geoespacial de la predicción de discursos de odio en urdu romano


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Medios sociales
Expresión política
Discurso de odio
Políticos
Opiniones públicas
Pakistán

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones


Descripción
Las redes sociales se han transformado en un canal crucial para la expresión política. Twitter, en particular, es una plataforma vital utilizada para intercambiar odio político en Pakistán. El discurso de odio político afecta la imagen pública de los políticos, apunta a sus seguidores y hiere los sentimientos públicos. El discurso de odio es un discurso público controvertido que promueve la violencia hacia una persona o grupo basado en características específicas. Aunque se han realizado estudios para identificar el discurso de odio en idiomas europeos, los idiomas romanos aún no han recibido mucha atención. En este trabajo de investigación, presentamos la detección automática de discurso de odio político en Roman Urdu. Se ha desarrollado un conjunto de datos etiquetado exclusivo de discurso de odio político (RU-PHS) que contiene 5002 instancias e información a nivel de ciudad. Para superar la vasta estructura léxica del Roman Urdu, proponemos un algoritmo para la unificación léxica del Roman Urdu. Se desarrollan tres técnicas de vectorización: TF-IDF, word2vec y fastText. Se presenta un análisis comparativo de la precisión y la complejidad temporal de modelos de aprendizaje automático convencionales y redes neuronales afinadas utilizando representaciones de palabras densas para clasificar y predecir el discurso de odio político. Los resultados muestran que un bosque aleatorio y la red neuronal de alimentación propuesta logran una precisión del 93% utilizando la incrustación de palabras fastText para distinguir entre un discurso neutral y políticamente ofensivo. La información estadística ayuda a identificar tendencias y patrones, y el análisis de puntos calientes y de agrupamiento ayuda a señalar a Punjab como un área altamente susceptible en Pakistán en términos de generación de tuits de odio político.

Otros recursos que podrían interesarte

Temas Virtualpro