Usando Procesamiento de Lenguaje Natural y Aprendizaje Automático para Detectar la Radicalización en Línea en el Idioma Maldiviano, Dhivehi
Autores: Ibrahim, Hussain; Ibrahim, Ahmed; Johnstone, Michael N.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Usando Procesamiento de Lenguaje Natural y Aprendizaje Automático para Detectar la Radicalización en Línea en el Idioma Maldiviano, Dhivehi
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección
Radicalización
Aprendizaje automático
Dhivehi
Contenido en línea
Naïve Bayes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección temprana de contenido radical en línea es importante para los servicios de inteligencia para combatir la radicalización y el terrorismo. La motivación para esta investigación fue la falta de herramientas lingüísticas en la detección de la radicalización en el idioma maldivo, Dhivehi. Esta investigación aplicó Aprendizaje Automático y Procesamiento de Lenguaje Natural (NLP) para detectar contenido de radicalización en línea en Dhivehi, con la incorporación de conocimiento específico del dominio. La investigación utilizó Aprendizaje Automático para evaluar la técnica más efectiva para la detección de texto de radicalización en Dhivehi y utilizó entrevistas con Expertos en la Materia y personas que se han desradicalizado para validar los resultados, agregar información contextual y mejorar la precisión del reconocimiento. Las contribuciones de esta investigación al cuerpo de conocimiento existente incluyen conjuntos de datos en forma de texto radical/no radical etiquetado, un corpus de sentimientos de palabras radicales y datos de entrevistas primarias de individuos desradicalizados, así como una técnica para la detección de texto de radicalización en Dhivehi por primera vez utilizando Aprendizaje Automático. Encontramos que el algoritmo de Naïve Bayes funcionó mejor para la detección de texto de radicalización en Dhivehi con una precisión del 87.67%, una precisión del 85.35%, un recall del 92.52% y un puntaje F2 del 91%. La inclusión de las palabras radicales identificadas a través de las entrevistas con los expertos como una característica de conteo mejoró el rendimiento de los algoritmos de Aprendizaje Automático y de Naïve Bayes en un 9.57%.
Descripción
La detección temprana de contenido radical en línea es importante para los servicios de inteligencia para combatir la radicalización y el terrorismo. La motivación para esta investigación fue la falta de herramientas lingüísticas en la detección de la radicalización en el idioma maldivo, Dhivehi. Esta investigación aplicó Aprendizaje Automático y Procesamiento de Lenguaje Natural (NLP) para detectar contenido de radicalización en línea en Dhivehi, con la incorporación de conocimiento específico del dominio. La investigación utilizó Aprendizaje Automático para evaluar la técnica más efectiva para la detección de texto de radicalización en Dhivehi y utilizó entrevistas con Expertos en la Materia y personas que se han desradicalizado para validar los resultados, agregar información contextual y mejorar la precisión del reconocimiento. Las contribuciones de esta investigación al cuerpo de conocimiento existente incluyen conjuntos de datos en forma de texto radical/no radical etiquetado, un corpus de sentimientos de palabras radicales y datos de entrevistas primarias de individuos desradicalizados, así como una técnica para la detección de texto de radicalización en Dhivehi por primera vez utilizando Aprendizaje Automático. Encontramos que el algoritmo de Naïve Bayes funcionó mejor para la detección de texto de radicalización en Dhivehi con una precisión del 87.67%, una precisión del 85.35%, un recall del 92.52% y un puntaje F2 del 91%. La inclusión de las palabras radicales identificadas a través de las entrevistas con los expertos como una característica de conteo mejoró el rendimiento de los algoritmos de Aprendizaje Automático y de Naïve Bayes en un 9.57%.