Predicción de Geolocalización de Publicaciones en Árabe (Tweet) de Grano Fino Usando Técnicas de Aprendizaje Profundo
Autores: Elteir, Marwa K.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Predicción de Geolocalización de Publicaciones en Árabe (Tweet) de Grano Fino Usando Técnicas de Aprendizaje Profundo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprovechando
Datos de twitter
Gestión de crisis
Geolocalización
Tuits en árabe
Arabia Saudita
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Aprovechar los datos de Twitter para la gestión de crisis requiere la geolocalización precisa y detallada de los tweets, que desafortunadamente a menudo falta, con solo el 1-3% de los tweets siendo geolocalizados. Este trabajo aborda el problema poco estudiado de la predicción de geolocalización detallada para tweets en árabe, centrándose en el Reino de Arabia Saudita. El objetivo es asignar con precisión los tweets a una de las trece provincias. Los enfoques existentes para la geolocalización en árabe son limitados en precisión y a menudo dependen de técnicas básicas de aprendizaje automático. Además, los avances en la geolocalización de tweets para otros idiomas a menudo se basan en conjuntos de datos distintos, lo que dificulta las comparaciones directas y las evaluaciones de su rendimiento relativo en conjuntos de datos árabes. Para cerrar esta brecha, investigamos ocho técnicas avanzadas de aprendizaje profundo, incluyendo dos modelos de lenguaje preentrenados en árabe (PLMs) en un conjunto de datos construido. A través de un análisis exhaustivo, evaluamos las fortalezas y debilidades de cada técnica para la geolocalización detallada de tweets en árabe. A pesar del éxito de los PLMs en varias tareas, nuestros resultados demuestran que una combinación de capas de Red Neuronal Convolucional (CNN) y Memoria a Largo y Corto Plazo (LSTM) produce el mejor rendimiento, logrando una precisión de prueba del 93.85%.
Descripción
Aprovechar los datos de Twitter para la gestión de crisis requiere la geolocalización precisa y detallada de los tweets, que desafortunadamente a menudo falta, con solo el 1-3% de los tweets siendo geolocalizados. Este trabajo aborda el problema poco estudiado de la predicción de geolocalización detallada para tweets en árabe, centrándose en el Reino de Arabia Saudita. El objetivo es asignar con precisión los tweets a una de las trece provincias. Los enfoques existentes para la geolocalización en árabe son limitados en precisión y a menudo dependen de técnicas básicas de aprendizaje automático. Además, los avances en la geolocalización de tweets para otros idiomas a menudo se basan en conjuntos de datos distintos, lo que dificulta las comparaciones directas y las evaluaciones de su rendimiento relativo en conjuntos de datos árabes. Para cerrar esta brecha, investigamos ocho técnicas avanzadas de aprendizaje profundo, incluyendo dos modelos de lenguaje preentrenados en árabe (PLMs) en un conjunto de datos construido. A través de un análisis exhaustivo, evaluamos las fortalezas y debilidades de cada técnica para la geolocalización detallada de tweets en árabe. A pesar del éxito de los PLMs en varias tareas, nuestros resultados demuestran que una combinación de capas de Red Neuronal Convolucional (CNN) y Memoria a Largo y Corto Plazo (LSTM) produce el mejor rendimiento, logrando una precisión de prueba del 93.85%.