Un modelo basado en atención que utiliza la composición de caracteres de entidades en la extracción de relaciones en chino
Autores: Han, Xiaoyu; Zhang, Yue; Zhang, Wenkai; Huang, Tinglei
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Un modelo basado en atención que utiliza la composición de caracteres de entidades en la extracción de relaciones en chino
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Extracción de relaciones
Procesamiento de lenguaje natural
Entidades
Información adicional
Caracteres chinos
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La extracción de relaciones es una tarea vital en el procesamiento del lenguaje natural. Su objetivo es identificar la relación entre dos entidades específicas en una oración. Además de la información contenida en la oración, se verifica que la información adicional sobre las entidades sea útil en la extracción de relaciones. La información adicional, como el tipo de entidad obtenido mediante NER (Reconocimiento de Entidades Nombradas) y la descripción proporcionada por la base de conocimientos, tiene sus limitaciones. Sin embargo, existe otra forma de proporcionar información adicional que puede superar estas limitaciones en la extracción de relaciones en chino. Dado que los caracteres chinos suelen tener significados explícitos y pueden llevar más información que las letras en inglés. Sugerimos que los caracteres que constituyen las entidades pueden proporcionar información adicional que es útil para la tarea de extracción de relaciones, especialmente en conjuntos de datos a gran escala. Esta suposición nunca ha sido verificada antes. El principal obstáculo es la falta de conjuntos de datos de relaciones chinas a gran escala. En este artículo, primero, generamos un conjunto de datos de extracción de relaciones chinas a gran escala basado en una enciclopedia china. En segundo lugar, proponemos un modelo basado en atención utilizando los caracteres que componen las entidades. El resultado en el conjunto de datos generado muestra que estos caracteres pueden proporcionar información útil para la tarea de extracción de relaciones en chino. Al utilizar esta información, el mecanismo de atención que utilizamos puede reconocer la parte crucial de la oración que puede expresar la relación. El modelo propuesto supera a otros modelos de referencia en nuestro conjunto de datos de extracción de relaciones chinas.
Descripción
La extracción de relaciones es una tarea vital en el procesamiento del lenguaje natural. Su objetivo es identificar la relación entre dos entidades específicas en una oración. Además de la información contenida en la oración, se verifica que la información adicional sobre las entidades sea útil en la extracción de relaciones. La información adicional, como el tipo de entidad obtenido mediante NER (Reconocimiento de Entidades Nombradas) y la descripción proporcionada por la base de conocimientos, tiene sus limitaciones. Sin embargo, existe otra forma de proporcionar información adicional que puede superar estas limitaciones en la extracción de relaciones en chino. Dado que los caracteres chinos suelen tener significados explícitos y pueden llevar más información que las letras en inglés. Sugerimos que los caracteres que constituyen las entidades pueden proporcionar información adicional que es útil para la tarea de extracción de relaciones, especialmente en conjuntos de datos a gran escala. Esta suposición nunca ha sido verificada antes. El principal obstáculo es la falta de conjuntos de datos de relaciones chinas a gran escala. En este artículo, primero, generamos un conjunto de datos de extracción de relaciones chinas a gran escala basado en una enciclopedia china. En segundo lugar, proponemos un modelo basado en atención utilizando los caracteres que componen las entidades. El resultado en el conjunto de datos generado muestra que estos caracteres pueden proporcionar información útil para la tarea de extracción de relaciones en chino. Al utilizar esta información, el mecanismo de atención que utilizamos puede reconocer la parte crucial de la oración que puede expresar la relación. El modelo propuesto supera a otros modelos de referencia en nuestro conjunto de datos de extracción de relaciones chinas.