Conocimiento basado en la respuesta visual de preguntas utilizando un gráfico semántico multimodal
Autores: Jiang, Lei; Meng, Zuqiang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Conocimiento basado en la respuesta visual de preguntas utilizando un gráfico semántico multimodal
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Campo
Respuesta visual a preguntas
Fuentes de conocimiento externas
Grafo semántico multimodal
Modelo de razonamiento del conocimiento
Información imagen-texto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
El campo de la respuesta visual a preguntas (VQA) ha experimentado una tendencia creciente de integrar fuentes de conocimiento externas para mejorar el rendimiento. Sin embargo, debido a la posible incompletitud de las fuentes de conocimiento externas y a la discrepancia inherente entre diferentes formas de datos, las técnicas actuales de respuesta visual a preguntas basadas en conocimiento (KBVQA) siguen enfrentando el desafío de integrar y utilizar de manera efectiva múltiples datos heterogéneos.
Descripción
El campo de la respuesta visual a preguntas (VQA) ha experimentado una tendencia creciente de integrar fuentes de conocimiento externas para mejorar el rendimiento. Sin embargo, debido a la posible incompletitud de las fuentes de conocimiento externas y a la discrepancia inherente entre diferentes formas de datos, las técnicas actuales de respuesta visual a preguntas basadas en conocimiento (KBVQA) siguen enfrentando el desafío de integrar y utilizar de manera efectiva múltiples datos heterogéneos.