Multi-task sequence tagging para la extracción de relaciones causales depuradas
Autores: Zhang, Yijia; Liu, Chaofan; Zhu, Yuan; Chen, Wanyu
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Multi-task sequence tagging para la extracción de relaciones causales depuradas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Extracción de relaciones causales en textos en lenguaje natural
Modelos existentes
Etiquetado de secuencias multi-tarea
MPC-CE
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Extraer relaciones causales de textos en lenguaje natural es crucial para descubrir la causalidad, y la mayoría de los modelos existentes de extracción de relaciones causales son modelos basados en aprendizaje de una sola tarea, que no pueden abordar de manera exhaustiva atributos como el etiquetado de partes del discurso y el análisis de fragmentos. Sin embargo, las características de las palabras con múltiples dominios son más relevantes para la extracción de relaciones causales, debido a palabras como adjetivos, verbos de enlace, etc., que aportan más datos ruidosos limitando la efectividad de los métodos de aprendizaje basados en una sola tarea. Además, las causalidades de diversos dominios también plantean un desafío, ya que los modelos existentes tienden a fallar en múltiples dominios en comparación con uno solo. A la luz de esto, proponemos un modelo de etiquetado de secuencia multi-tarea, MPC-CE, que utiliza más información sobre causalidad y tareas relevantes para mejorar la extracción de relaciones causales en datos ruidosos. Al modelar tareas auxiliares, MPC-CE promueve una comprensión jerárquica de la estructura lingüística y los roles semánticos, filtrando ruido y aislando entidades relevantes. Además, el paradigma de intercambio escaso extrae solo los parámetros más ampliamente beneficiosos al podar los redundantes durante el entrenamiento, mejorando la generalización del modelo. Los resultados empíricos en dos conjuntos de datos muestran una mejora del 2,19% y 3,12% en F1, respectivamente, en comparación con los baselines, demostrando que nuestro modelo propuesto puede mejorar efectivamente la extracción de relaciones causales con características semánticas a través de múltiples tareas sintácticas, ofreciendo el poder representativo para superar el ruido y los problemas de dominio cruzado.
Descripción
Extraer relaciones causales de textos en lenguaje natural es crucial para descubrir la causalidad, y la mayoría de los modelos existentes de extracción de relaciones causales son modelos basados en aprendizaje de una sola tarea, que no pueden abordar de manera exhaustiva atributos como el etiquetado de partes del discurso y el análisis de fragmentos. Sin embargo, las características de las palabras con múltiples dominios son más relevantes para la extracción de relaciones causales, debido a palabras como adjetivos, verbos de enlace, etc., que aportan más datos ruidosos limitando la efectividad de los métodos de aprendizaje basados en una sola tarea. Además, las causalidades de diversos dominios también plantean un desafío, ya que los modelos existentes tienden a fallar en múltiples dominios en comparación con uno solo. A la luz de esto, proponemos un modelo de etiquetado de secuencia multi-tarea, MPC-CE, que utiliza más información sobre causalidad y tareas relevantes para mejorar la extracción de relaciones causales en datos ruidosos. Al modelar tareas auxiliares, MPC-CE promueve una comprensión jerárquica de la estructura lingüística y los roles semánticos, filtrando ruido y aislando entidades relevantes. Además, el paradigma de intercambio escaso extrae solo los parámetros más ampliamente beneficiosos al podar los redundantes durante el entrenamiento, mejorando la generalización del modelo. Los resultados empíricos en dos conjuntos de datos muestran una mejora del 2,19% y 3,12% en F1, respectivamente, en comparación con los baselines, demostrando que nuestro modelo propuesto puede mejorar efectivamente la extracción de relaciones causales con características semánticas a través de múltiples tareas sintácticas, ofreciendo el poder representativo para superar el ruido y los problemas de dominio cruzado.