Un resumen legal de alta precisión en dos etapas
Autores: Huang, Yue; Sun, Lijuan; Han, Chong; Guo, Jian
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un resumen legal de alta precisión en dos etapas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Juicios legales
Resumen
Texto
Información
Modelo
Palabras clave
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Las sentencias legales suelen ser muy largas y la información relevante a menudo está dispersa a lo largo del texto. Para completar una síntesis de sentencias legales, es crucial capturar de manera comprensiva la información importante y relevante de un texto extenso. Los modelos existentes de resumen abtractivo basados en lenguaje preentrenado tienen restricciones en la longitud del texto de entrada. Otra preocupación es que los resúmenes generados no se han integrado bien con los términos técnicos y temas específicos de las sentencias legales. En este artículo, utilizamos sentencias legales en bruto como información de diferentes granularidades y propusimos un modelo de resumen de texto de dos etapas para manejar diferentes granularidades de información. Específicamente, tratamos las sentencias legales como una secuencia de oraciones y seleccionamos conjuntos de oraciones clave de los textos completos como un corpus de entrada para la generación de resúmenes. Además, extraímos palabras clave relacionadas con términos técnicos y temas específicos en los textos legales e las introdujimos en el modelo de generación de resúmenes como un mecanismo de atención. Los resultados experimentales en los conjuntos de datos CAIL2020 y LCRD mostraron que nuestro modelo logró una mejora general del 0.19-0.41 en su puntuación ROUGE, en comparación con los modelos de referencia. Un análisis adicional también mostró que nuestro método podría capturar de manera comprensiva la información esencial y relevante de textos legales extensos y generar mejores resúmenes de sentencias legales.
Descripción
Las sentencias legales suelen ser muy largas y la información relevante a menudo está dispersa a lo largo del texto. Para completar una síntesis de sentencias legales, es crucial capturar de manera comprensiva la información importante y relevante de un texto extenso. Los modelos existentes de resumen abtractivo basados en lenguaje preentrenado tienen restricciones en la longitud del texto de entrada. Otra preocupación es que los resúmenes generados no se han integrado bien con los términos técnicos y temas específicos de las sentencias legales. En este artículo, utilizamos sentencias legales en bruto como información de diferentes granularidades y propusimos un modelo de resumen de texto de dos etapas para manejar diferentes granularidades de información. Específicamente, tratamos las sentencias legales como una secuencia de oraciones y seleccionamos conjuntos de oraciones clave de los textos completos como un corpus de entrada para la generación de resúmenes. Además, extraímos palabras clave relacionadas con términos técnicos y temas específicos en los textos legales e las introdujimos en el modelo de generación de resúmenes como un mecanismo de atención. Los resultados experimentales en los conjuntos de datos CAIL2020 y LCRD mostraron que nuestro modelo logró una mejora general del 0.19-0.41 en su puntuación ROUGE, en comparación con los modelos de referencia. Un análisis adicional también mostró que nuestro método podría capturar de manera comprensiva la información esencial y relevante de textos legales extensos y generar mejores resúmenes de sentencias legales.