logo móvil
Contáctanos

Un modelo basado en atención que utiliza la composición de caracteres de entidades en la extracción de relaciones en chino

Autores: Han, Xiaoyu; Zhang, Yue; Zhang, Wenkai; Huang, Tinglei

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Un modelo basado en atención que utiliza la composición de caracteres de entidades en la extracción de relaciones en chino


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Extracción de relaciones
Procesamiento de lenguaje natural
Entidades
Información adicional
Caracteres chinos
Mecanismo de atención

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La extracción de relaciones es una tarea vital en el procesamiento del lenguaje natural. Su objetivo es identificar la relación entre dos entidades específicas en una oración. Además de la información contenida en la oración, se verifica que la información adicional sobre las entidades sea útil en la extracción de relaciones. La información adicional, como el tipo de entidad obtenido mediante NER (Reconocimiento de Entidades Nombradas) y la descripción proporcionada por la base de conocimientos, tiene sus limitaciones. Sin embargo, existe otra forma de proporcionar información adicional que puede superar estas limitaciones en la extracción de relaciones en chino. Dado que los caracteres chinos suelen tener significados explícitos y pueden llevar más información que las letras en inglés. Sugerimos que los caracteres que constituyen las entidades pueden proporcionar información adicional que es útil para la tarea de extracción de relaciones, especialmente en conjuntos de datos a gran escala. Esta suposición nunca ha sido verificada antes. El principal obstáculo es la falta de conjuntos de datos de relaciones chinas a gran escala. En este artículo, primero, generamos un conjunto de datos de extracción de relaciones chinas a gran escala basado en una enciclopedia china. En segundo lugar, proponemos un modelo basado en atención utilizando los caracteres que componen las entidades. El resultado en el conjunto de datos generado muestra que estos caracteres pueden proporcionar información útil para la tarea de extracción de relaciones en chino. Al utilizar esta información, el mecanismo de atención que utilizamos puede reconocer la parte crucial de la oración que puede expresar la relación. El modelo propuesto supera a otros modelos de referencia en nuestro conjunto de datos de extracción de relaciones chinas.

Otros recursos que podrían interesarte

Temas Virtualpro