Redes bayesianas para el preprocesamiento de datos de gestión del agua
Autores: Ropero, Rosa Fernández; Flores, María Julia; Rumí, Rafael
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Redes bayesianas para el preprocesamiento de datos de gestión del agua
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos ambientales
Tareas de modelado
Recolección de datos
Estimación de riesgo de inundación
Modelo de regresión
Clasificación no supervisada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Los datos ambientales a menudo presentan inconvenientes que dificultan las tareas de modelado. Durante la fase de recolección de datos, se encontraron dos problemas: (i) un bloque de cinco meses de datos no estaba disponible y (ii) no se recopiló información del área costera, lo que dificultó la estimación del riesgo de inundación. Por lo tanto, nuestro objetivo es explorar y proporcionar posibles soluciones a ambos problemas. Para evitar eliminar una variable (o esos meses faltantes), la solución propuesta es un modelo de regresión basado en BN que utiliza estructuras gráficas probabilísticas fijas para imputar la variable faltante de la manera más precisa posible. Para el segundo problema, la falta de información, se desarrolló un método de clasificación no supervisada basado en BN para predecir el riesgo de inundación en el área costera. Los resultados mostraron que la solución de regresión propuesta podría predecir el comportamiento de la variable continua faltante, evitando el inconveniente inicial de rechazarla. Además, el clasificador no supervisado podría clasificar todas las observaciones en un conjunto de grupos según el comportamiento del río aguas arriba y la información de lluvia, y devolver la probabilidad de pertenecer a cada grupo, proporcionando predicciones adecuadas sobre el riesgo de inundación en el área costera.
Descripción
Los datos ambientales a menudo presentan inconvenientes que dificultan las tareas de modelado. Durante la fase de recolección de datos, se encontraron dos problemas: (i) un bloque de cinco meses de datos no estaba disponible y (ii) no se recopiló información del área costera, lo que dificultó la estimación del riesgo de inundación. Por lo tanto, nuestro objetivo es explorar y proporcionar posibles soluciones a ambos problemas. Para evitar eliminar una variable (o esos meses faltantes), la solución propuesta es un modelo de regresión basado en BN que utiliza estructuras gráficas probabilísticas fijas para imputar la variable faltante de la manera más precisa posible. Para el segundo problema, la falta de información, se desarrolló un método de clasificación no supervisada basado en BN para predecir el riesgo de inundación en el área costera. Los resultados mostraron que la solución de regresión propuesta podría predecir el comportamiento de la variable continua faltante, evitando el inconveniente inicial de rechazarla. Además, el clasificador no supervisado podría clasificar todas las observaciones en un conjunto de grupos según el comportamiento del río aguas arriba y la información de lluvia, y devolver la probabilidad de pertenecer a cada grupo, proporcionando predicciones adecuadas sobre el riesgo de inundación en el área costera.