La fusión cruzada multimodal mejorada semánticamente para una mejor descripción de imágenes no supervisada
Autores: Xiang, Nan; Chen, Ling; Liang, Leiyan; Rao, Xingdi; Gong, Zehao
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
La fusión cruzada multimodal mejorada semánticamente para una mejor descripción de imágenes no supervisada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Subtitulado de imágenes
Desafíos
Modelo de fusión multimodal mejorado semánticamente
SCFM
Relaciones semánticas
Tareas multimodales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 58
Citaciones: Sin citaciones
La SCFM demuestra mejoras significativas sobre el modelo de referencia, mejorando las métricas CIDEr y BLEU-4 en un 3.6% y 3.2%, respectivamente.
Descripción
La SCFM demuestra mejoras significativas sobre el modelo de referencia, mejorando las métricas CIDEr y BLEU-4 en un 3.6% y 3.2%, respectivamente.