Evaluación de técnicas de resumen automático de textos legales para la jurisprudencia griega
Autores: Koniaris, Marios; Galanis, Dimitris; Giannini, Eugenia; Tsanakas, Panayiotis
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Evaluación de técnicas de resumen automático de textos legales para la jurisprudencia griega
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Información legal
En línea
Resumen automático de textos
Documentos legales
Desafíos
Idioma griego
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La creciente cantidad de información legal disponible en línea es abrumadora tanto para los ciudadanos como para los profesionales del derecho, lo que dificulta y consume tiempo encontrar información relevante y mantenerse al día con los últimos desarrollos legales. Las técnicas de resumen automático de texto pueden ser muy beneficiosas, ya que ahorran tiempo, reducen costos y disminuyen la carga cognitiva de los profesionales del derecho. Sin embargo, aplicar estas técnicas a documentos legales presenta varios desafíos debido a la complejidad de los documentos legales y la falta de recursos necesarios, especialmente en lenguas con pocos recursos lingüísticos, como el griego. En este artículo, abordamos el resumen automático de documentos legales griegos. Un desafío importante en esta área es la falta de conjuntos de datos adecuados en lengua griega. En respuesta, desarrollamos un nuevo conjunto de datos rico en metadatos que consiste en sentencias seleccionadas del Tribunal Supremo Civil y Penal de Grecia, junto con sus resúmenes de referencia y etiquetas de categoría, adaptados para el propósito de resumen automático de documentos legales. También adoptamos varios métodos de vanguardia para el resumen abstractivo y extractivo y realizamos una evaluación exhaustiva de los métodos utilizando métricas tanto humanas como automáticas. Nuestros resultados: (i) revelaron que, si bien los métodos extractivos exhiben un rendimiento promedio, los métodos abstractivos generan texto moderadamente fluido y coherente, pero tienden a recibir bajas puntuaciones en métricas de relevancia y consistencia; (ii) indicaron la necesidad de métricas que capturen mejor la coherencia, relevancia y consistencia del resumen de un documento legal; (iii) demostraron que el ajuste fino de los modelos BERT en una tarea específica puede mejorar significativamente el rendimiento del modelo.
Descripción
La creciente cantidad de información legal disponible en línea es abrumadora tanto para los ciudadanos como para los profesionales del derecho, lo que dificulta y consume tiempo encontrar información relevante y mantenerse al día con los últimos desarrollos legales. Las técnicas de resumen automático de texto pueden ser muy beneficiosas, ya que ahorran tiempo, reducen costos y disminuyen la carga cognitiva de los profesionales del derecho. Sin embargo, aplicar estas técnicas a documentos legales presenta varios desafíos debido a la complejidad de los documentos legales y la falta de recursos necesarios, especialmente en lenguas con pocos recursos lingüísticos, como el griego. En este artículo, abordamos el resumen automático de documentos legales griegos. Un desafío importante en esta área es la falta de conjuntos de datos adecuados en lengua griega. En respuesta, desarrollamos un nuevo conjunto de datos rico en metadatos que consiste en sentencias seleccionadas del Tribunal Supremo Civil y Penal de Grecia, junto con sus resúmenes de referencia y etiquetas de categoría, adaptados para el propósito de resumen automático de documentos legales. También adoptamos varios métodos de vanguardia para el resumen abstractivo y extractivo y realizamos una evaluación exhaustiva de los métodos utilizando métricas tanto humanas como automáticas. Nuestros resultados: (i) revelaron que, si bien los métodos extractivos exhiben un rendimiento promedio, los métodos abstractivos generan texto moderadamente fluido y coherente, pero tienden a recibir bajas puntuaciones en métricas de relevancia y consistencia; (ii) indicaron la necesidad de métricas que capturen mejor la coherencia, relevancia y consistencia del resumen de un documento legal; (iii) demostraron que el ajuste fino de los modelos BERT en una tarea específica puede mejorar significativamente el rendimiento del modelo.