Automatización de la simplificación de texto para lituano: transformando textos administrativos en lenguaje sencillo
Autores: Mandravickait, Justina; Rimkien, Egl; Kapkan, Danguol Kotryna; Kalinauskait, Danguol; enys, Antanas; Krilaviius, Tomas
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Automatización de la simplificación de texto para lituano: transformando textos administrativos en lenguaje sencillo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudio
Experimentos
Simplificación de texto
Idioma lituano
MT5
MBART
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
En este estudio, presentamos los resultados de experimentos sobre la simplificación de textos para el idioma lituano, donde buscamos simplificar textos de estilo administrativo al nivel de Lenguaje Claro. Seleccionamos mT5, mBART y LT-Llama-2 como modelos fundamentales y los ajustamos para la tarea de simplificación de textos. Además, evaluamos ChatGPT para este propósito. También realizamos una evaluación exhaustiva de los resultados de simplificación proporcionados por estos modelos tanto cuantitativa como cualitativamente. Los resultados demostraron que mBART fue el modelo más efectivo para simplificar textos administrativos lituanos, logrando las puntuaciones más altas en todas las métricas de evaluación. Una evaluación cualitativa de las oraciones simplificadas complementó nuestros hallazgos cuantitativos. El análisis de atención proporcionó información sobre las decisiones del modelo, resaltando fortalezas en las simplificaciones léxicas y sintácticas pero revelando desafíos con oraciones más largas y complejas. Nuestros hallazgos contribuyen al avance de la simplificación de textos para idiomas con menos recursos, con aplicaciones prácticas para una comunicación más efectiva entre instituciones y el público en general, que es el objetivo del Lenguaje Claro.
Descripción
En este estudio, presentamos los resultados de experimentos sobre la simplificación de textos para el idioma lituano, donde buscamos simplificar textos de estilo administrativo al nivel de Lenguaje Claro. Seleccionamos mT5, mBART y LT-Llama-2 como modelos fundamentales y los ajustamos para la tarea de simplificación de textos. Además, evaluamos ChatGPT para este propósito. También realizamos una evaluación exhaustiva de los resultados de simplificación proporcionados por estos modelos tanto cuantitativa como cualitativamente. Los resultados demostraron que mBART fue el modelo más efectivo para simplificar textos administrativos lituanos, logrando las puntuaciones más altas en todas las métricas de evaluación. Una evaluación cualitativa de las oraciones simplificadas complementó nuestros hallazgos cuantitativos. El análisis de atención proporcionó información sobre las decisiones del modelo, resaltando fortalezas en las simplificaciones léxicas y sintácticas pero revelando desafíos con oraciones más largas y complejas. Nuestros hallazgos contribuyen al avance de la simplificación de textos para idiomas con menos recursos, con aplicaciones prácticas para una comunicación más efectiva entre instituciones y el público en general, que es el objetivo del Lenguaje Claro.