Modulación de Puentes para la Construcción Automatizada de Cadenas de Pensamiento en el Razonamiento Meteorológico: Un Estudio sobre WeatherQA
Autores: Cui, Hang; Gu, Jiqing; Peng, Jing; Wang, Tiejun; Wu, Xi
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Modulación de Puentes para la Construcción Automatizada de Cadenas de Pensamiento en el Razonamiento Meteorológico: Un Estudio sobre WeatherQA
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estudio
Marco de puente de modalidades
Cadena de Pensamiento
Razonamiento
Imágenes meteorológicas
Extracción semántica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio aplica un marco de puenteo de modalidades para construir automáticamente razonamientos de Cadena de Pensamiento (CoT) a partir de imágenes meteorológicas, reduciendo la necesidad de anotaciones expertas. El pipeline propuesto integra extracción semántica, generación de Pseudo-CoT y fusión lógica para producir cadenas de razonamiento estructuradas. Usando el benchmark WeatherQA, construimos conjuntos de datos bajo configuraciones de imagen única, 3 imágenes y 20 imágenes, con variantes automatizadas y guiadas por expertos, y evaluamos el rendimiento en tareas de Áreas Afectadas y Preocupación Condicional. Los resultados muestran un razonamiento espacial casi experto y CoTs más compactos y bien alineados con entradas de imágenes reducidas. Las configuraciones de múltiples imágenes revelan desafíos en la integración de pistas visuales densas, mientras que la clasificación semántica sigue siendo difícil debido a la ambigüedad de las etiquetas. En general, el puenteo de modalidades ofrece un enfoque escalable, interpretable y de bajo costo para el razonamiento meteorológico multimodal.
Descripción
Este estudio aplica un marco de puenteo de modalidades para construir automáticamente razonamientos de Cadena de Pensamiento (CoT) a partir de imágenes meteorológicas, reduciendo la necesidad de anotaciones expertas. El pipeline propuesto integra extracción semántica, generación de Pseudo-CoT y fusión lógica para producir cadenas de razonamiento estructuradas. Usando el benchmark WeatherQA, construimos conjuntos de datos bajo configuraciones de imagen única, 3 imágenes y 20 imágenes, con variantes automatizadas y guiadas por expertos, y evaluamos el rendimiento en tareas de Áreas Afectadas y Preocupación Condicional. Los resultados muestran un razonamiento espacial casi experto y CoTs más compactos y bien alineados con entradas de imágenes reducidas. Las configuraciones de múltiples imágenes revelan desafíos en la integración de pistas visuales densas, mientras que la clasificación semántica sigue siendo difícil debido a la ambigüedad de las etiquetas. En general, el puenteo de modalidades ofrece un enfoque escalable, interpretable y de bajo costo para el razonamiento meteorológico multimodal.