logo móvil
Contáctanos

Conocimiento basado en la respuesta visual de preguntas utilizando un gráfico semántico multimodal

Autores: Jiang, Lei; Meng, Zuqiang

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Conocimiento basado en la respuesta visual de preguntas utilizando un gráfico semántico multimodal


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Campo
Respuesta visual a preguntas
Fuentes de conocimiento externas
Grafo semántico multimodal
Modelo de razonamiento del conocimiento
Información imagen-texto

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
El campo de la respuesta visual a preguntas (VQA) ha experimentado una tendencia creciente de integrar fuentes de conocimiento externas para mejorar el rendimiento. Sin embargo, debido a la posible incompletitud de las fuentes de conocimiento externas y a la discrepancia inherente entre diferentes formas de datos, las técnicas actuales de respuesta visual a preguntas basadas en conocimiento (KBVQA) siguen enfrentando el desafío de integrar y utilizar de manera efectiva múltiples datos heterogéneos.

Otros recursos que podrían interesarte

Temas Virtualpro