Texto de simplificación a niveles específicos de legibilidad
Autores: Alkaldi, Wejdan; Inkpen, Diana
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Texto de simplificación a niveles específicos de legibilidad
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Documento
Lector
Habilidades
Nivel de legibilidad
Técnicas de aprendizaje profundo
Modelos de simplificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
La capacidad de leer un documento depende de las habilidades del lector y del nivel de legibilidad del texto. En este documento, proponemos un sistema que utiliza técnicas de aprendizaje profundo para simplificar textos con el fin de que coincidan con el nivel del lector. Utilizamos un enfoque novedoso con un bucle de aprendizaje por refuerzo que contiene un clasificador de legibilidad. La salida del clasificador se utiliza para decidir si se necesita más simplificación, hasta que se alcance el nivel de legibilidad deseado. Los modelos de simplificación se entrenan con datos anotados con niveles de legibilidad del corpus de Newsela. Nuestros modelos de simplificación funcionan a nivel de oración, para simplificar cada oración y cumplir con el nivel de legibilidad especificado. Utilizamos una versión del corpus de Newsela alineada a nivel de oración. También producimos un conjunto de datos aumentado mediante la anotación automática de más pares de oraciones utilizando un clasificador de nivel de legibilidad. Nuestros modelos de simplificación de texto logran un mejor rendimiento que las técnicas de vanguardia para esta tarea.
Descripción
La capacidad de leer un documento depende de las habilidades del lector y del nivel de legibilidad del texto. En este documento, proponemos un sistema que utiliza técnicas de aprendizaje profundo para simplificar textos con el fin de que coincidan con el nivel del lector. Utilizamos un enfoque novedoso con un bucle de aprendizaje por refuerzo que contiene un clasificador de legibilidad. La salida del clasificador se utiliza para decidir si se necesita más simplificación, hasta que se alcance el nivel de legibilidad deseado. Los modelos de simplificación se entrenan con datos anotados con niveles de legibilidad del corpus de Newsela. Nuestros modelos de simplificación funcionan a nivel de oración, para simplificar cada oración y cumplir con el nivel de legibilidad especificado. Utilizamos una versión del corpus de Newsela alineada a nivel de oración. También producimos un conjunto de datos aumentado mediante la anotación automática de más pares de oraciones utilizando un clasificador de nivel de legibilidad. Nuestros modelos de simplificación de texto logran un mejor rendimiento que las técnicas de vanguardia para esta tarea.