Una revisión de la literatura sobre métodos y conjuntos de datos para la detección de discursos de odio textuales
Autores: Alkomah, Fatimah; Ma, Xiaogang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una revisión de la literatura sobre métodos y conjuntos de datos para la detección de discursos de odio textuales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
En línea
Discursos tóxicos
Discurso de odio
Revisiones de literatura
Conjuntos de datos
Sistemas de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los discursos tóxicos en línea podrían resultar en conflictos entre grupos o dañar a las comunidades en línea. El discurso de odio es un contenido dañino u ofensivo, complejo y multifacético, que tiene como objetivo a individuos o grupos. Las revisiones de literatura existentes generalmente se han centrado en una categoría particular de discurso de odio y, hasta donde sabemos, no ha habido ninguna revisión dedicada a los conjuntos de datos de discurso de odio. Este artículo revisa sistemáticamente los sistemas de detección de discurso de odio textual y destaca sus conjuntos de datos principales, características textuales y modelos de aprendizaje automático. Los resultados de esta revisión de literatura se integran con el análisis de contenido, resultando en varios temas para 138 documentos relevantes. Este estudio muestra varios enfoques que no proporcionan resultados consistentes en varias categorías de discurso de odio. Los conjuntos de métodos más dominantes combinan más de un modelo de aprendizaje profundo. Además, el análisis de varios conjuntos de datos de discurso de odio muestra que muchos conjuntos de datos son pequeños en tamaño y no son confiables para diversas tareas de detección de discurso de odio. Por lo tanto, este estudio proporciona a la comunidad de investigación información y evidencia empírica sobre las propiedades intrínsecas del discurso de odio y ayuda a las comunidades a identificar temas para trabajos futuros.
Descripción
Los discursos tóxicos en línea podrían resultar en conflictos entre grupos o dañar a las comunidades en línea. El discurso de odio es un contenido dañino u ofensivo, complejo y multifacético, que tiene como objetivo a individuos o grupos. Las revisiones de literatura existentes generalmente se han centrado en una categoría particular de discurso de odio y, hasta donde sabemos, no ha habido ninguna revisión dedicada a los conjuntos de datos de discurso de odio. Este artículo revisa sistemáticamente los sistemas de detección de discurso de odio textual y destaca sus conjuntos de datos principales, características textuales y modelos de aprendizaje automático. Los resultados de esta revisión de literatura se integran con el análisis de contenido, resultando en varios temas para 138 documentos relevantes. Este estudio muestra varios enfoques que no proporcionan resultados consistentes en varias categorías de discurso de odio. Los conjuntos de métodos más dominantes combinan más de un modelo de aprendizaje profundo. Además, el análisis de varios conjuntos de datos de discurso de odio muestra que muchos conjuntos de datos son pequeños en tamaño y no son confiables para diversas tareas de detección de discurso de odio. Por lo tanto, este estudio proporciona a la comunidad de investigación información y evidencia empírica sobre las propiedades intrínsecas del discurso de odio y ayuda a las comunidades a identificar temas para trabajos futuros.