Cluereader: red de atención de gráficos heterogéneos para comprensión de lectura de máquinas de múltiples saltos
Autores: Gao, Peng; Gao, Feng; Wang, Peng; Ni, Jian-Cheng; Wang, Fei; Fujita, Hamido
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Cluereader: red de atención de gráficos heterogéneos para comprensión de lectura de máquinas de múltiples saltos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Lectura automática de máquinas
Procesamiento de lenguaje natural
Redes convolucionales de grafos
Mecanismo de atención
Grafo heterogéneo
Grafo de razonamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La tarea desafiante de comprensión de lectura de máquinas de múltiples saltos es un desafío en el procesamiento del lenguaje natural, ya que requiere una mayor capacidad de razonamiento a través de múltiples documentos. Los modelos espectrales basados en redes convolucionales de grafos han demostrado buenas habilidades de inferencia y han llevado a resultados competitivos. Sin embargo, el análisis y razonamiento de algunos son inconsistentes con los de los humanos. Inspirado en el concepto de neurociencia cognitiva, proponemos un modelo de red de atención de gráficos heterogéneos llamado para imitar el concepto. El modelo está diseñado para ensamblar las características semánticas en representaciones de múltiples niveles y concentrar o aliviar automáticamente la información para el razonamiento a través del mecanismo de atención. El nombre es una metáfora del patrón del modelo: considera a los sujetos de las consultas como puntos de inicio de pistas, toma las entidades de razonamiento como puntos de puente, considera a las entidades candidatas latentes como, y las pistas terminan en las entidades candidatas. El modelo propuesto permite la visualización del grafo de razonamiento, lo que hace posible analizar la importancia de los bordes que conectan las entidades y la selectividad en las menciones y nodos candidatos, lo cual es más fácil de comprender empíricamente. Las evaluaciones en el conjunto de datos de lectura de múltiples saltos de dominio abierto y el conjunto de datos de interacción fármaco-fármaco demostraron la validez de y mostraron la viabilidad de su aplicación del modelo en el dominio de la biología molecular.
Descripción
La tarea desafiante de comprensión de lectura de máquinas de múltiples saltos es un desafío en el procesamiento del lenguaje natural, ya que requiere una mayor capacidad de razonamiento a través de múltiples documentos. Los modelos espectrales basados en redes convolucionales de grafos han demostrado buenas habilidades de inferencia y han llevado a resultados competitivos. Sin embargo, el análisis y razonamiento de algunos son inconsistentes con los de los humanos. Inspirado en el concepto de neurociencia cognitiva, proponemos un modelo de red de atención de gráficos heterogéneos llamado para imitar el concepto. El modelo está diseñado para ensamblar las características semánticas en representaciones de múltiples niveles y concentrar o aliviar automáticamente la información para el razonamiento a través del mecanismo de atención. El nombre es una metáfora del patrón del modelo: considera a los sujetos de las consultas como puntos de inicio de pistas, toma las entidades de razonamiento como puntos de puente, considera a las entidades candidatas latentes como, y las pistas terminan en las entidades candidatas. El modelo propuesto permite la visualización del grafo de razonamiento, lo que hace posible analizar la importancia de los bordes que conectan las entidades y la selectividad en las menciones y nodos candidatos, lo cual es más fácil de comprender empíricamente. Las evaluaciones en el conjunto de datos de lectura de múltiples saltos de dominio abierto y el conjunto de datos de interacción fármaco-fármaco demostraron la validez de y mostraron la viabilidad de su aplicación del modelo en el dominio de la biología molecular.