logo móvil
Contáctanos

Puenteando Brechas Lingüísticas: Desarrollo de un Conjunto de Datos de Simplificación de Texto en Griego

Autores: Agathos, Leonidas; Avgoustis, Andreas; Kryelesi, Xristiana; Makridou, Aikaterini; Tzanis, Ilias; Mouratidis, Despoina; Kermanidis, Katia Lida; Kanavos, Andreas

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Puenteando Brechas Lingüísticas: Desarrollo de un Conjunto de Datos de Simplificación de Texto en Griego


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Simplificación de texto
Gramática griega
Conjunto de datos
Comprensión
Aprendizaje automático
Barreras lingüísticas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La simplificación del texto es crucial para cerrar la brecha de comprensión en el entorno rico en información de hoy. A pesar de los avances en la simplificación de textos en inglés, los idiomas con estructuras gramaticales intrincadas, como el griego, a menudo permanecen poco explorados. La complejidad de la gramática griega, caracterizada por su orden sintáctico flexible, presenta desafíos únicos que dificultan la comprensión para hablantes nativos, estudiantes, turistas y estudiantes internacionales. Este artículo presenta un conjunto de datos integral para la simplificación de textos en griego, que contiene más de 7500 oraciones sobre diversos temas como historia, ciencia y cultura, diseñado para abordar estos desafíos. Esbozamos la metodología para compilar este conjunto de datos, incluyendo una colección de textos de Wikipedia en griego, su anotación con versiones simplificadas y el establecimiento de métricas de evaluación robustas. Además, el artículo detalla la implementación de medidas de control de calidad y la aplicación de técnicas de aprendizaje automático para analizar la complejidad del texto. Nuestros resultados experimentales demuestran la efectividad inicial del conjunto de datos y su potencial para reducir las barreras lingüísticas y mejorar la comunicación, con modelos iniciales de aprendizaje automático que muestran direcciones prometedoras para futuras mejoras en la clasificación de la complejidad del texto. El desarrollo de este conjunto de datos marca un paso significativo hacia la mejora de la accesibilidad y la comprensión para una amplia audiencia de hablantes y aprendices de griego, fomentando una sociedad más inclusiva.

Otros recursos que podrían interesarte

Temas Virtualpro