Puenteando Brechas Lingüísticas: Desarrollo de un Conjunto de Datos de Simplificación de Texto en Griego
Autores: Agathos, Leonidas; Avgoustis, Andreas; Kryelesi, Xristiana; Makridou, Aikaterini; Tzanis, Ilias; Mouratidis, Despoina; Kermanidis, Katia Lida; Kanavos, Andreas
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Puenteando Brechas Lingüísticas: Desarrollo de un Conjunto de Datos de Simplificación de Texto en Griego
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Simplificación de texto
Gramática griega
Conjunto de datos
Comprensión
Aprendizaje automático
Barreras lingüísticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La simplificación del texto es crucial para cerrar la brecha de comprensión en el entorno rico en información de hoy. A pesar de los avances en la simplificación de textos en inglés, los idiomas con estructuras gramaticales intrincadas, como el griego, a menudo permanecen poco explorados. La complejidad de la gramática griega, caracterizada por su orden sintáctico flexible, presenta desafíos únicos que dificultan la comprensión para hablantes nativos, estudiantes, turistas y estudiantes internacionales. Este artículo presenta un conjunto de datos integral para la simplificación de textos en griego, que contiene más de 7500 oraciones sobre diversos temas como historia, ciencia y cultura, diseñado para abordar estos desafíos. Esbozamos la metodología para compilar este conjunto de datos, incluyendo una colección de textos de Wikipedia en griego, su anotación con versiones simplificadas y el establecimiento de métricas de evaluación robustas. Además, el artículo detalla la implementación de medidas de control de calidad y la aplicación de técnicas de aprendizaje automático para analizar la complejidad del texto. Nuestros resultados experimentales demuestran la efectividad inicial del conjunto de datos y su potencial para reducir las barreras lingüísticas y mejorar la comunicación, con modelos iniciales de aprendizaje automático que muestran direcciones prometedoras para futuras mejoras en la clasificación de la complejidad del texto. El desarrollo de este conjunto de datos marca un paso significativo hacia la mejora de la accesibilidad y la comprensión para una amplia audiencia de hablantes y aprendices de griego, fomentando una sociedad más inclusiva.
Descripción
La simplificación del texto es crucial para cerrar la brecha de comprensión en el entorno rico en información de hoy. A pesar de los avances en la simplificación de textos en inglés, los idiomas con estructuras gramaticales intrincadas, como el griego, a menudo permanecen poco explorados. La complejidad de la gramática griega, caracterizada por su orden sintáctico flexible, presenta desafíos únicos que dificultan la comprensión para hablantes nativos, estudiantes, turistas y estudiantes internacionales. Este artículo presenta un conjunto de datos integral para la simplificación de textos en griego, que contiene más de 7500 oraciones sobre diversos temas como historia, ciencia y cultura, diseñado para abordar estos desafíos. Esbozamos la metodología para compilar este conjunto de datos, incluyendo una colección de textos de Wikipedia en griego, su anotación con versiones simplificadas y el establecimiento de métricas de evaluación robustas. Además, el artículo detalla la implementación de medidas de control de calidad y la aplicación de técnicas de aprendizaje automático para analizar la complejidad del texto. Nuestros resultados experimentales demuestran la efectividad inicial del conjunto de datos y su potencial para reducir las barreras lingüísticas y mejorar la comunicación, con modelos iniciales de aprendizaje automático que muestran direcciones prometedoras para futuras mejoras en la clasificación de la complejidad del texto. El desarrollo de este conjunto de datos marca un paso significativo hacia la mejora de la accesibilidad y la comprensión para una amplia audiencia de hablantes y aprendices de griego, fomentando una sociedad más inclusiva.