Red profunda para la detección de violencia de género en mensajes de Twitter
Autores: Castorena, Carlos M.; Abundez, Itzel M.; Alejo, Roberto; Granda-Gutiérrez, Everardo E.; Rendón, Eréndira; Villegas, Octavio
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Red profunda para la detección de violencia de género en mensajes de Twitter
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Problema de violencia de género en México mediante el aprendizaje automático y las redes neuronales en Twitter
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
El problema de la violencia de género en México ha aumentado considerablemente. Muchas asociaciones sociales e instituciones gubernamentales han abordado este problema de diferentes maneras. En el contexto de la informática, se ha desarrollado cierto esfuerzo para abordar este problema a través del uso de enfoques de aprendizaje automático para fortalecer la toma de decisiones estratégicas. En este trabajo, se presenta una aplicación de red neuronal de aprendizaje profundo para identificar la violencia de género en mensajes de Twitter. Un total de 1,857,450 mensajes (generados en México) fueron descargados de Twitter: 61,604 de ellos fueron etiquetados manualmente por voluntarios humanos como mensajes negativos, positivos o neutrales, para servir como conjuntos de datos de entrenamiento y prueba. Los resultados presentados en este documento muestran la efectividad de la red neuronal profunda (alrededor del 80% del área bajo la curva ROC) en la detección de la violencia de género en mensajes de Twitter. La principal contribución de esta investigación es que el conjunto de datos fue mínimamente preprocesado (como diferencia frente a la mayoría de los enfoques más avanzados). Así, los mensajes originales se convirtieron en un vector numérico de acuerdo con la frecuencia de aparición de las palabras y solo se eliminaron adverbios, conjunciones y preposiciones (que ocurren con mucha frecuencia en el texto y creemos que estas palabras no contribuyen a mensajes discriminatorios en Twitter). Finalmente, este trabajo contribuye a abordar la violencia de género en México, que es un problema que debe enfrentarse de inmediato.
Descripción
El problema de la violencia de género en México ha aumentado considerablemente. Muchas asociaciones sociales e instituciones gubernamentales han abordado este problema de diferentes maneras. En el contexto de la informática, se ha desarrollado cierto esfuerzo para abordar este problema a través del uso de enfoques de aprendizaje automático para fortalecer la toma de decisiones estratégicas. En este trabajo, se presenta una aplicación de red neuronal de aprendizaje profundo para identificar la violencia de género en mensajes de Twitter. Un total de 1,857,450 mensajes (generados en México) fueron descargados de Twitter: 61,604 de ellos fueron etiquetados manualmente por voluntarios humanos como mensajes negativos, positivos o neutrales, para servir como conjuntos de datos de entrenamiento y prueba. Los resultados presentados en este documento muestran la efectividad de la red neuronal profunda (alrededor del 80% del área bajo la curva ROC) en la detección de la violencia de género en mensajes de Twitter. La principal contribución de esta investigación es que el conjunto de datos fue mínimamente preprocesado (como diferencia frente a la mayoría de los enfoques más avanzados). Así, los mensajes originales se convirtieron en un vector numérico de acuerdo con la frecuencia de aparición de las palabras y solo se eliminaron adverbios, conjunciones y preposiciones (que ocurren con mucha frecuencia en el texto y creemos que estas palabras no contribuyen a mensajes discriminatorios en Twitter). Finalmente, este trabajo contribuye a abordar la violencia de género en México, que es un problema que debe enfrentarse de inmediato.