Un enfoque basado en mecanismo de atención cruzada y algoritmo de mejora de etiquetas para la predicción de juicios legales
Autores: Chen, Junyi; Zhang, Xuanqing; Zhou, Xiabing; Han, Yingjie; Zhou, Qinglei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un enfoque basado en mecanismo de atención cruzada y algoritmo de mejora de etiquetas para la predicción de juicios legales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Predicción de sentencias legales
Casos legales
Artículos de ley
Información de etiqueta
Gráfico de similitud de crímenes
Palabras clave discriminativas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
La Predicción de Sentencias Legales tiene como objetivo predecir automáticamente los resultados de las sentencias basándose en descripciones de casos legales y artículos de ley establecidos, y ha recibido una atención creciente. En el trabajo preliminar, varios problemas aún no han sido resueltos adecuadamente. Uno de ellos es cómo utilizar la información de etiquetas limitada pero valiosa. Los métodos existentes en su mayoría ignoran la brecha entre la descripción de artículos establecidos y casos, pero los integran directamente. En segundo lugar, la mayoría de los estudios ignoran la restricción mutua entre las subtareas, como lógicamente o semánticamente, cada cargo está relacionado solo con algunos artículos específicos. Para abordar estos problemas, primero construimos un grafo de similitud de crímenes y luego realizamos una operación de destilación para recopilar palabras clave discriminativas para cada cargo. Además, fusionamos estas palabras clave discriminativas en lugar de descripciones de artículos establecidos en la incrustación del caso con un mecanismo de atención cruzada para obtener representaciones semánticas profundas de los casos que incorporan información de etiquetas. Finalmente, bajo una restricción entre las subtareas, optimizamos la representación one-hot de las etiquetas de verdad en el suelo para garantizar resultados consistentes en las subtareas basados en el algoritmo de mejora de etiquetas. Para verificar la efectividad y robustez de nuestro marco, realizamos experimentos extensos en dos conjuntos de datos públicos. Los resultados experimentales muestran que el método propuesto supera a los modelos de vanguardia en un 3.89%/7.92% y un 1.23%/2.50% en el puntaje F1 promedio de las subtareas en CAIL-Small/Big, respectivamente.
Descripción
La Predicción de Sentencias Legales tiene como objetivo predecir automáticamente los resultados de las sentencias basándose en descripciones de casos legales y artículos de ley establecidos, y ha recibido una atención creciente. En el trabajo preliminar, varios problemas aún no han sido resueltos adecuadamente. Uno de ellos es cómo utilizar la información de etiquetas limitada pero valiosa. Los métodos existentes en su mayoría ignoran la brecha entre la descripción de artículos establecidos y casos, pero los integran directamente. En segundo lugar, la mayoría de los estudios ignoran la restricción mutua entre las subtareas, como lógicamente o semánticamente, cada cargo está relacionado solo con algunos artículos específicos. Para abordar estos problemas, primero construimos un grafo de similitud de crímenes y luego realizamos una operación de destilación para recopilar palabras clave discriminativas para cada cargo. Además, fusionamos estas palabras clave discriminativas en lugar de descripciones de artículos establecidos en la incrustación del caso con un mecanismo de atención cruzada para obtener representaciones semánticas profundas de los casos que incorporan información de etiquetas. Finalmente, bajo una restricción entre las subtareas, optimizamos la representación one-hot de las etiquetas de verdad en el suelo para garantizar resultados consistentes en las subtareas basados en el algoritmo de mejora de etiquetas. Para verificar la efectividad y robustez de nuestro marco, realizamos experimentos extensos en dos conjuntos de datos públicos. Los resultados experimentales muestran que el método propuesto supera a los modelos de vanguardia en un 3.89%/7.92% y un 1.23%/2.50% en el puntaje F1 promedio de las subtareas en CAIL-Small/Big, respectivamente.