Reconocimiento de escritura a mano en mongol en línea basado en una estructura codificador-decodificador con modelo de lenguaje
Autores: Fan, Daoerji; Sun, Yuxin; Wang, Zhixin; Peng, Yanjun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reconocimiento de escritura a mano en mongol en línea basado en una estructura codificador-decodificador con modelo de lenguaje
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Mongol
En línea
Reconocimiento de escritura a mano
Modelo de lenguaje
Secuencia a secuencia
Mecanismos de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
El reconocimiento de escritura a mano en línea en mongol es una tarea compleja debido a los caracteres intrincados y al extenso vocabulario del guion. Este estudio propone un enfoque novedoso al integrar un modelo de lenguaje preentrenado en el modelo de secuencia a secuencia (Seq2Seq) + mecanismos de atención (AM) para mejorar la precisión del reconocimiento. Se presentan tres modelos de fusión, incluyendo fusión anterior, posterior y completa, que muestran mejoras sustanciales sobre el modelo base. El modelo de fusión completa, combinado con parámetros de modelo de lenguaje sincronizados, logró los mejores resultados, reduciendo significativamente las tasas de error de caracteres y palabras. Esta investigación presenta una solución prometedora para el reconocimiento preciso de escritura a mano en línea en mongol, ofreciendo aplicaciones prácticas en la preservación y utilización del guion mongol.
Descripción
El reconocimiento de escritura a mano en línea en mongol es una tarea compleja debido a los caracteres intrincados y al extenso vocabulario del guion. Este estudio propone un enfoque novedoso al integrar un modelo de lenguaje preentrenado en el modelo de secuencia a secuencia (Seq2Seq) + mecanismos de atención (AM) para mejorar la precisión del reconocimiento. Se presentan tres modelos de fusión, incluyendo fusión anterior, posterior y completa, que muestran mejoras sustanciales sobre el modelo base. El modelo de fusión completa, combinado con parámetros de modelo de lenguaje sincronizados, logró los mejores resultados, reduciendo significativamente las tasas de error de caracteres y palabras. Esta investigación presenta una solución prometedora para el reconocimiento preciso de escritura a mano en línea en mongol, ofreciendo aplicaciones prácticas en la preservación y utilización del guion mongol.