logo móvil
Contáctanos

La fusión cruzada multimodal mejorada semánticamente para una mejor descripción de imágenes no supervisada

Autores: Xiang, Nan; Chen, Ling; Liang, Leiyan; Rao, Xingdi; Gong, Zehao

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

La fusión cruzada multimodal mejorada semánticamente para una mejor descripción de imágenes no supervisada


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Subtitulado de imágenes
Desafíos
Modelo de fusión multimodal mejorado semánticamente
SCFM
Relaciones semánticas
Tareas multimodales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 58

Citaciones: Sin citaciones


Descripción
La SCFM demuestra mejoras significativas sobre el modelo de referencia, mejorando las métricas CIDEr y BLEU-4 en un 3.6% y 3.2%, respectivamente.

Otros recursos que podrían interesarte

Temas Virtualpro