Generación mejorada de indicaciones para la respuesta a preguntas abiertas multimodales
Autores: Cui, Chenhao; Li, Zhoujun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Generación mejorada de indicaciones para la respuesta a preguntas abiertas multimodales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Recuperación de imágenes
textos
modelo de generación
rendimiento de recuperación
visión-lenguaje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La respuesta generada en la pregunta abierta multimodal implica recuperar información relevante tanto de imágenes como de sus textos correspondientes dada una pregunta y luego generar la respuesta.
Descripción
La respuesta generada en la pregunta abierta multimodal implica recuperar información relevante tanto de imágenes como de sus textos correspondientes dada una pregunta y luego generar la respuesta.