Un marco de fusión de atención de secuencia a secuencia convolucional para el razonamiento causal de sentido común
Autores: Luo, Zhiyi; Liu, Yizhu; Luo, Shuyun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un marco de fusión de atención de secuencia a secuencia convolucional para el razonamiento causal de sentido común
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Razonamiento causal
Dependencia causal
Causas
Efectos
CausalNet
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
El razonamiento causal del sentido común es el proceso de comprender la dependencia causal entre eventos o acciones comunes. Tradicionalmente, se planteaba como un problema de selección. Sin embargo, no podemos obtener suficientes candidatos y necesitamos causas (o efectos) más flexibles en muchos escenarios, como problemas de preguntas y respuestas basados en causas. Por lo tanto, la capacidad de generar causas (o efectos) es un problema importante. En este documento, proponemos un mecanismo de atención causal que aprovecha el conocimiento externo de CausalNet, seguido de un mecanismo de fusión novedoso que combina la orientación global de dependencia causal de la atención causal con la dependencia causal local obtenida a través de la atención suave de varias capas dentro de la arquitectura CNN seq2seq. Los resultados experimentales demuestran consistentemente la superioridad del marco propuesto, logrando puntuaciones BLEU-1 de 20.06 y 36.94, puntuaciones BLEU-2 de 9.98 y 27.78, y tasas de precisión evaluadas por humanos del 35% y 52% para dos conjuntos de datos de evaluación, superando a todos los demás baselines en todas las métricas en ambos conjuntos de datos de evaluación.
Descripción
El razonamiento causal del sentido común es el proceso de comprender la dependencia causal entre eventos o acciones comunes. Tradicionalmente, se planteaba como un problema de selección. Sin embargo, no podemos obtener suficientes candidatos y necesitamos causas (o efectos) más flexibles en muchos escenarios, como problemas de preguntas y respuestas basados en causas. Por lo tanto, la capacidad de generar causas (o efectos) es un problema importante. En este documento, proponemos un mecanismo de atención causal que aprovecha el conocimiento externo de CausalNet, seguido de un mecanismo de fusión novedoso que combina la orientación global de dependencia causal de la atención causal con la dependencia causal local obtenida a través de la atención suave de varias capas dentro de la arquitectura CNN seq2seq. Los resultados experimentales demuestran consistentemente la superioridad del marco propuesto, logrando puntuaciones BLEU-1 de 20.06 y 36.94, puntuaciones BLEU-2 de 9.98 y 27.78, y tasas de precisión evaluadas por humanos del 35% y 52% para dos conjuntos de datos de evaluación, superando a todos los demás baselines en todas las métricas en ambos conjuntos de datos de evaluación.