Ahogándose en la Inundación de Información: Clasificación de Relevancia Basada en Aprendizaje Automático de Tweets Relacionados con Inundaciones para la Gestión de Desastres
Autores: Blomeier, Eike; Schmidt, Sebastian; Resch, Bernd
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Ahogándose en la Inundación de Información: Clasificación de Relevancia Basada en Aprendizaje Automático de Tweets Relacionados con Inundaciones para la Gestión de Desastres
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Desastre
Medios sociales geoespaciales
Modelos de aprendizaje automático
Tweets relacionados con inundaciones
BERT
Gestión de desastres
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En las primeras etapas de un desastre causado por un peligro natural (por ejemplo, una inundación), la cantidad de información disponible y útil es baja. Para llenar este vacío informativo, los respondedores de emergencia están utilizando cada vez más datos de las redes sociales geoespaciales para obtener información de testigos presenciales y construir una mejor comprensión de la situación y diseñar respuestas efectivas. Sin embargo, filtrar contenido relevante para este propósito representa un desafío. Este trabajo presenta una comparación de diferentes modelos de aprendizaje automático (Naïve Bayes, Random Forest, Support Vector Machine, Redes Neuronales Convolucionales, BERT) para la clasificación de relevancia semántica de Tweets en alemán relacionados con inundaciones. Para ello, nos basamos en un conjunto de datos de entrenamiento de cuatro categorías creado con la ayuda de expertos de organizaciones de ayuda humanitaria. Identificamos a BERT ajustado como el modelo más adecuado, promediando una precisión del 71% con la mayoría de las malas clasificaciones ocurriendo entre clases similares. Así, demostramos que nuestra metodología ayuda a identificar información relevante para una gestión de desastres más eficiente.
Descripción
En las primeras etapas de un desastre causado por un peligro natural (por ejemplo, una inundación), la cantidad de información disponible y útil es baja. Para llenar este vacío informativo, los respondedores de emergencia están utilizando cada vez más datos de las redes sociales geoespaciales para obtener información de testigos presenciales y construir una mejor comprensión de la situación y diseñar respuestas efectivas. Sin embargo, filtrar contenido relevante para este propósito representa un desafío. Este trabajo presenta una comparación de diferentes modelos de aprendizaje automático (Naïve Bayes, Random Forest, Support Vector Machine, Redes Neuronales Convolucionales, BERT) para la clasificación de relevancia semántica de Tweets en alemán relacionados con inundaciones. Para ello, nos basamos en un conjunto de datos de entrenamiento de cuatro categorías creado con la ayuda de expertos de organizaciones de ayuda humanitaria. Identificamos a BERT ajustado como el modelo más adecuado, promediando una precisión del 71% con la mayoría de las malas clasificaciones ocurriendo entre clases similares. Así, demostramos que nuestra metodología ayuda a identificar información relevante para una gestión de desastres más eficiente.