Investigación sobre la Respuesta Automática a Preguntas de un Grafo de Conocimiento Generativo Basado en Redes de Punteros
Autores: Liu, Shuang; Tan, Nannan; Ge, Yaqian; Luka, Niko
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Investigación sobre la Respuesta Automática a Preguntas de un Grafo de Conocimiento Generativo Basado en Redes de Punteros
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sistemas de respuesta a preguntas
Gráficos de conocimiento
Preguntas y Respuestas de la Base de Conocimiento Chino
Método generativo
Construcción de vocabulario de conocimiento
Generación de respuestas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los sistemas de respuesta a preguntas basados en gráficos de conocimiento son tareas extremadamente desafiantes en el campo del procesamiento del lenguaje natural. La mayoría de los sistemas existentes de Preguntas y Respuestas de Bases de Conocimiento Chinas (KBQA) solo pueden devolver el conocimiento almacenado en la base de conocimiento mediante métodos extractivos. Sin embargo, este procesamiento no se ajusta a los hábitos de lectura y no puede resolver el problema de las palabras fuera del vocabulario (OOV). En este artículo, se propone un nuevo método generativo de respuesta a preguntas basado en gráficos de conocimiento, que incluye tres partes: construcción del vocabulario de conocimiento, preprocesamiento de datos y generación de respuestas. En la construcción de la lista de palabras, se utiliza BiLSTM-CRF para identificar la entidad en el texto fuente, encontrar los triples contenidos en la entidad, contar la frecuencia de las palabras y construirla. En la parte de preprocesamiento de datos, se adopta un modelo de lenguaje preentrenado BERT que combina características semánticas de frecuencia de palabras para obtener vectores de palabras. En la parte de generación de respuestas, se propone una combinación de un vocabulario construido por el gráfico de conocimiento y una red generadora de punteros (PGN) para señalar la entidad correspondiente y generar la respuesta. Los resultados experimentales muestran que el método propuesto puede lograr un rendimiento superior en conjuntos de datos WebQA en comparación con otros métodos.
Descripción
Los sistemas de respuesta a preguntas basados en gráficos de conocimiento son tareas extremadamente desafiantes en el campo del procesamiento del lenguaje natural. La mayoría de los sistemas existentes de Preguntas y Respuestas de Bases de Conocimiento Chinas (KBQA) solo pueden devolver el conocimiento almacenado en la base de conocimiento mediante métodos extractivos. Sin embargo, este procesamiento no se ajusta a los hábitos de lectura y no puede resolver el problema de las palabras fuera del vocabulario (OOV). En este artículo, se propone un nuevo método generativo de respuesta a preguntas basado en gráficos de conocimiento, que incluye tres partes: construcción del vocabulario de conocimiento, preprocesamiento de datos y generación de respuestas. En la construcción de la lista de palabras, se utiliza BiLSTM-CRF para identificar la entidad en el texto fuente, encontrar los triples contenidos en la entidad, contar la frecuencia de las palabras y construirla. En la parte de preprocesamiento de datos, se adopta un modelo de lenguaje preentrenado BERT que combina características semánticas de frecuencia de palabras para obtener vectores de palabras. En la parte de generación de respuestas, se propone una combinación de un vocabulario construido por el gráfico de conocimiento y una red generadora de punteros (PGN) para señalar la entidad correspondiente y generar la respuesta. Los resultados experimentales muestran que el método propuesto puede lograr un rendimiento superior en conjuntos de datos WebQA en comparación con otros métodos.