Traducción: Traducción automática en la era de los grandes modelos de lenguaje: Una encuesta de problemas históricos y emergentes
Autores: Ataman, Duygu; Birch, Alexandra; Habash, Nizar; Federico, Marcello; Koehn, Philipp; Cho, Kyunghyun
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Traducción: Traducción automática en la era de los grandes modelos de lenguaje: Una encuesta de problemas históricos y emergentes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Inteligencia artificial
Traducción automática
Modelos
Modelos de lenguaje
Procesamiento de lenguaje natural
Investigación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Históricamente considerado como una de las tareas más desafiantes para lograr una inteligencia artificial (IA) completa, la investigación en traducción automática (TA) ha visto una dedicación continua en la última década, resultando en arquitecturas de vanguardia para el modelado de información secuencial. Mientras que la mayoría de los modelos estadísticos tradicionalmente se basaban en la idea de aprender de ejemplos de traducción paralela, investigaciones recientes que exploran métodos de aprendizaje auto-supervisado y de múltiples tareas han ampliado las capacidades de los modelos de TA, permitiendo eventualmente la creación de modelos de lenguaje de propósito general (LLMs). Además de la versatilidad en proporcionar traducciones útiles a través de idiomas y dominios, los LLMs pueden, en principio, realizar cualquier tarea de procesamiento de lenguaje natural (NLP) dado un número suficiente de ejemplos específicos de la tarea. Mientras que los LLMs ahora alcanzan un punto en el que pueden tanto reemplazar como aumentar los modelos de TA tradicionales, la extensión de sus ventajas y las formas en que aprovechan las capacidades de traducción a través de tareas multilingües de NLP sigue siendo un amplio campo para la exploración. En esta revisión de literatura, presentamos una introducción a la posición actual de la investigación en TA con una mirada histórica a diferentes enfoques de modelado de TA, cómo estos podrían ser ventajosos para la solución de problemas particulares, y qué problemas se resuelven o permanecen abiertos en relación con los desarrollos recientes. También discutimos la conexión de los modelos de TA que conducen al desarrollo de arquitecturas prominentes de LLM, cómo continúan apoyando el rendimiento de los LLM en diferentes tareas al proporcionar un medio para la transferencia de conocimiento entre lenguas, y la redefinición de la tarea con las posibilidades que la tecnología LLM trae.
Descripción
Históricamente considerado como una de las tareas más desafiantes para lograr una inteligencia artificial (IA) completa, la investigación en traducción automática (TA) ha visto una dedicación continua en la última década, resultando en arquitecturas de vanguardia para el modelado de información secuencial. Mientras que la mayoría de los modelos estadísticos tradicionalmente se basaban en la idea de aprender de ejemplos de traducción paralela, investigaciones recientes que exploran métodos de aprendizaje auto-supervisado y de múltiples tareas han ampliado las capacidades de los modelos de TA, permitiendo eventualmente la creación de modelos de lenguaje de propósito general (LLMs). Además de la versatilidad en proporcionar traducciones útiles a través de idiomas y dominios, los LLMs pueden, en principio, realizar cualquier tarea de procesamiento de lenguaje natural (NLP) dado un número suficiente de ejemplos específicos de la tarea. Mientras que los LLMs ahora alcanzan un punto en el que pueden tanto reemplazar como aumentar los modelos de TA tradicionales, la extensión de sus ventajas y las formas en que aprovechan las capacidades de traducción a través de tareas multilingües de NLP sigue siendo un amplio campo para la exploración. En esta revisión de literatura, presentamos una introducción a la posición actual de la investigación en TA con una mirada histórica a diferentes enfoques de modelado de TA, cómo estos podrían ser ventajosos para la solución de problemas particulares, y qué problemas se resuelven o permanecen abiertos en relación con los desarrollos recientes. También discutimos la conexión de los modelos de TA que conducen al desarrollo de arquitecturas prominentes de LLM, cómo continúan apoyando el rendimiento de los LLM en diferentes tareas al proporcionar un medio para la transferencia de conocimiento entre lenguas, y la redefinición de la tarea con las posibilidades que la tecnología LLM trae.