El ruido mejora la traducción multimodal de máquinas: repensando el papel del contexto visual
Autores: Ma, Xinyu; Rao, Jun; Liu, Xuebo
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
El ruido mejora la traducción multimodal de máquinas: repensando el papel del contexto visual
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Traducción automática
Multimodal
Información visual
Modelos MMT
Modelos de referencia
Métricas de evaluación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
La traducción multimodal automática (MMT) durante mucho tiempo se ha considerado superior a la traducción automática tradicional de texto solo al aprovechar la información visual. Sin embargo, estudios recientes desafían esta suposición, mostrando que los modelos MMT tienen un rendimiento similar incluso cuando se prueban sin imágenes o con imágenes no coincidentes. Esto plantea preguntas fundamentales sobre la utilidad real de la información visual en MMT, que este trabajo busca investigar.
Descripción
La traducción multimodal automática (MMT) durante mucho tiempo se ha considerado superior a la traducción automática tradicional de texto solo al aprovechar la información visual. Sin embargo, estudios recientes desafían esta suposición, mostrando que los modelos MMT tienen un rendimiento similar incluso cuando se prueban sin imágenes o con imágenes no coincidentes. Esto plantea preguntas fundamentales sobre la utilidad real de la información visual en MMT, que este trabajo busca investigar.