Tdjee: un modelo conjunto a nivel de documento para la extracción de eventos financieros
Autores: Wang, Peng; Deng, Zhenkai; Cui, Ruilong
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Tdjee: un modelo conjunto a nivel de documento para la extracción de eventos financieros
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Eventos financieros
Inversores
Modelos de extracción de eventos
Modelo de extracción conjunta de eventos a nivel de documento basado en Transformer
Datos etiquetados
Base de conocimientos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Extraer eventos financieros de numerosos anuncios financieros es muy importante para que los inversores tomen decisiones correctas. Sin embargo, sigue siendo un desafío que los argumentos de los eventos siempre se dispersen en múltiples oraciones en un anuncio financiero, mientras que la mayoría de los modelos de extracción de eventos existentes solo funcionan en escenarios a nivel de oración. Para abordar este problema, este documento propone un modelo de Extracción Conjunta de Eventos a Nivel de Documento basado en Transformer y consciente de las relaciones (TDJEE), que codifica las relaciones entre las palabras en el contexto y aprovecha un Transformer modificado para capturar información a nivel de documento y completar los argumentos del evento. Mientras tanto, la ausencia de datos etiquetados en el dominio financiero podría hacer que los modelos sean inestables en los resultados de extracción, lo que se conoce como el problema de inicio en frío. Además, se propone una base de conocimientos basada en Fonduer combinada con el método de supervisión a distancia para simplificar la etiquetación de eventos y proporcionar un corpus de entrenamiento etiquetado de alta calidad para la capacitación y evaluación del modelo. Los resultados experimentales en anuncios financieros chinos del mundo real muestran que, en comparación con otros modelos, TDJEE logra resultados competitivos y puede extraer efectivamente argumentos de eventos a lo largo de múltiples oraciones.
Descripción
Extraer eventos financieros de numerosos anuncios financieros es muy importante para que los inversores tomen decisiones correctas. Sin embargo, sigue siendo un desafío que los argumentos de los eventos siempre se dispersen en múltiples oraciones en un anuncio financiero, mientras que la mayoría de los modelos de extracción de eventos existentes solo funcionan en escenarios a nivel de oración. Para abordar este problema, este documento propone un modelo de Extracción Conjunta de Eventos a Nivel de Documento basado en Transformer y consciente de las relaciones (TDJEE), que codifica las relaciones entre las palabras en el contexto y aprovecha un Transformer modificado para capturar información a nivel de documento y completar los argumentos del evento. Mientras tanto, la ausencia de datos etiquetados en el dominio financiero podría hacer que los modelos sean inestables en los resultados de extracción, lo que se conoce como el problema de inicio en frío. Además, se propone una base de conocimientos basada en Fonduer combinada con el método de supervisión a distancia para simplificar la etiquetación de eventos y proporcionar un corpus de entrenamiento etiquetado de alta calidad para la capacitación y evaluación del modelo. Los resultados experimentales en anuncios financieros chinos del mundo real muestran que, en comparación con otros modelos, TDJEE logra resultados competitivos y puede extraer efectivamente argumentos de eventos a lo largo de múltiples oraciones.