Un Marco de Aprendizaje de Representaciones Contrastivas para la Identificación de Causalidad de Eventos
Autores: Liao, Guixiang; Chen, Yanli; Ke, Wei; Wu, Hanzhou; Dong, Zhicheng
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un Marco de Aprendizaje de Representaciones Contrastivas para la Identificación de Causalidad de Eventos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Identificación de causalidad de eventos
ECI
Modelos basados en transformadores
Aprendizaje contrastivo
Incrustaciones de etiquetas causales
Aprendizaje de representaciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para abordar los desafíos asociados con la identificación de relaciones causales entre menciones de eventos en la tarea de identificación de causalidad de eventos (ECI), ECI ha surgido como un área de investigación fundamental para comprender las estructuras de eventos. Estudios recientes han aprovechado modelos basados en Transformadores, aumentados por componentes auxiliares, para desarrollar representaciones contextuales efectivas para la predicción de causalidad. Un paso crítico en los modelos de ECI implica transformar representaciones complejas del contexto de eventos en representaciones de etiquetas causales, facilitando así los cálculos de puntuación lógica necesarios tanto para el entrenamiento como para la inferencia. Sin embargo, los modelos existentes dependen con frecuencia de redes feedforward simplistas para este proceso de transformación, que a menudo luchan por cerrar la brecha semántica entre contextos de eventos complejos y etiquetas causales objetivo, particularmente en escenarios lingüísticamente matizados. Para abordar estas limitaciones, proponemos el Aprendizaje Contrastivo para la Identificación de Causalidad de Eventos (CLECI), un marco innovador de ECI que mejora el aprendizaje de representaciones a través de la integración de técnicas de aprendizaje contrastivo, un mecanismo generador-discriminador con incrustaciones de etiquetas causales. A diferencia de los métodos de transformación directa tradicionales, CLECI genera incrustaciones de etiquetas causales latentes que filtran información irrelevante mientras se alinean con representaciones de etiquetas potenciales. Al incorporar principios de aprendizaje contrastivo, CLECI aumenta aún más la capacidad discriminativa de las representaciones de eventos al construir pares positivos y negativos de eventos. Las evaluaciones experimentales realizadas en los conjuntos de datos EventStoryLine (ESL), Causal-TimeBank (CTB) y MECI demuestran que CLECI logra un rendimiento competitivo, con mejoras en la puntuación F1 del 4.3%, 7.9% y 2.5%, respectivamente, en comparación con los métodos de referencia más fuertes, manteniendo una fuerte robustez en contextos de eventos multilingües complejos y ruidosos.
Descripción
Para abordar los desafíos asociados con la identificación de relaciones causales entre menciones de eventos en la tarea de identificación de causalidad de eventos (ECI), ECI ha surgido como un área de investigación fundamental para comprender las estructuras de eventos. Estudios recientes han aprovechado modelos basados en Transformadores, aumentados por componentes auxiliares, para desarrollar representaciones contextuales efectivas para la predicción de causalidad. Un paso crítico en los modelos de ECI implica transformar representaciones complejas del contexto de eventos en representaciones de etiquetas causales, facilitando así los cálculos de puntuación lógica necesarios tanto para el entrenamiento como para la inferencia. Sin embargo, los modelos existentes dependen con frecuencia de redes feedforward simplistas para este proceso de transformación, que a menudo luchan por cerrar la brecha semántica entre contextos de eventos complejos y etiquetas causales objetivo, particularmente en escenarios lingüísticamente matizados. Para abordar estas limitaciones, proponemos el Aprendizaje Contrastivo para la Identificación de Causalidad de Eventos (CLECI), un marco innovador de ECI que mejora el aprendizaje de representaciones a través de la integración de técnicas de aprendizaje contrastivo, un mecanismo generador-discriminador con incrustaciones de etiquetas causales. A diferencia de los métodos de transformación directa tradicionales, CLECI genera incrustaciones de etiquetas causales latentes que filtran información irrelevante mientras se alinean con representaciones de etiquetas potenciales. Al incorporar principios de aprendizaje contrastivo, CLECI aumenta aún más la capacidad discriminativa de las representaciones de eventos al construir pares positivos y negativos de eventos. Las evaluaciones experimentales realizadas en los conjuntos de datos EventStoryLine (ESL), Causal-TimeBank (CTB) y MECI demuestran que CLECI logra un rendimiento competitivo, con mejoras en la puntuación F1 del 4.3%, 7.9% y 2.5%, respectivamente, en comparación con los métodos de referencia más fuertes, manteniendo una fuerte robustez en contextos de eventos multilingües complejos y ruidosos.