Diseño e Implementación de un Agente de Servicio Web Inteligente Basado en Seq2Seq y Rastreador de Sitios Web
Autores: Hsih, Mei-Hua; Yang, Jian-Xin; Hsieh, Chen-Chiung
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Diseño e Implementación de un Agente de Servicio Web Inteligente Basado en Seq2Seq y Rastreador de Sitios Web
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Rastreador web
árbol de diálogo
Agente de servicio al cliente
Seq2Seq
Mecanismo de atención
LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento propone utilizar un rastreador web para organizar el contenido de los sitios web como un árbol de diálogo en algunos dominios. Construimos un agente de servicio al cliente inteligente basado en este árbol de diálogo para uso general. Se utiliza la arquitectura de codificador-decodificador Seq2Seq para entender el lenguaje natural y luego se modifica como un LSTM bidireccional para aumentar la precisión en los casos de polisemia. Se añade un mecanismo de atención en el decodificador para mejorar el problema de la disminución de precisión a medida que la oración crece en longitud. Realizamos cuatro experimentos. El primero es un experimento de ablación que demuestra que Seq2Seq + LSTM bidireccional + mecanismo de atención es superior a LSTM, Seq2Seq, Seq2Seq + mecanismo de atención en el procesamiento del lenguaje natural. Utilizando un corpus chino de código abierto para las pruebas, la precisión fue del 82.1%, 63.4%, 69.2% y 76.1%, respectivamente. El segundo experimento utiliza conocimiento del dominio objetivo para hacer preguntas. Se utilizaron cinco mil datos de la Compañía de Suministro de Agua de Taiwán como datos de entrenamiento objetivo, y se utilizaron mil preguntas que diferían de los datos de entrenamiento pero relacionadas con el agua para las pruebas. La precisión de RasaNLU y este estudio fue del 86.4% y 87.1%, respectivamente. El tercer experimento utiliza conocimiento de dominios no objetivos para hacer preguntas y compara las respuestas de RasaNLU con el modelo de red neuronal propuesto. Se extrajeron cinco mil preguntas como datos de entrenamiento, incluyendo bases de datos de chat de ocho fuentes públicas como Weibo, Tieba, Douban y otros sitios de redes sociales bien conocidos en China continental y PTT en Taiwán. Luego, se extrajeron 1000 preguntas del mismo corpus que diferían de los datos de entrenamiento para las pruebas. La precisión de este estudio fue del 83.2%, lo que es mucho mejor que RasaNLU. Se confirma que el modelo propuesto es más preciso en el campo general. El último experimento compara este estudio con asistentes de voz como Xiao Ai, Google Assistant, Siri y Samsung Bixby. Aunque este estudio no puede responder preguntas vagas con precisión, es más preciso en los campos de aplicación entrenados.
Descripción
Este documento propone utilizar un rastreador web para organizar el contenido de los sitios web como un árbol de diálogo en algunos dominios. Construimos un agente de servicio al cliente inteligente basado en este árbol de diálogo para uso general. Se utiliza la arquitectura de codificador-decodificador Seq2Seq para entender el lenguaje natural y luego se modifica como un LSTM bidireccional para aumentar la precisión en los casos de polisemia. Se añade un mecanismo de atención en el decodificador para mejorar el problema de la disminución de precisión a medida que la oración crece en longitud. Realizamos cuatro experimentos. El primero es un experimento de ablación que demuestra que Seq2Seq + LSTM bidireccional + mecanismo de atención es superior a LSTM, Seq2Seq, Seq2Seq + mecanismo de atención en el procesamiento del lenguaje natural. Utilizando un corpus chino de código abierto para las pruebas, la precisión fue del 82.1%, 63.4%, 69.2% y 76.1%, respectivamente. El segundo experimento utiliza conocimiento del dominio objetivo para hacer preguntas. Se utilizaron cinco mil datos de la Compañía de Suministro de Agua de Taiwán como datos de entrenamiento objetivo, y se utilizaron mil preguntas que diferían de los datos de entrenamiento pero relacionadas con el agua para las pruebas. La precisión de RasaNLU y este estudio fue del 86.4% y 87.1%, respectivamente. El tercer experimento utiliza conocimiento de dominios no objetivos para hacer preguntas y compara las respuestas de RasaNLU con el modelo de red neuronal propuesto. Se extrajeron cinco mil preguntas como datos de entrenamiento, incluyendo bases de datos de chat de ocho fuentes públicas como Weibo, Tieba, Douban y otros sitios de redes sociales bien conocidos en China continental y PTT en Taiwán. Luego, se extrajeron 1000 preguntas del mismo corpus que diferían de los datos de entrenamiento para las pruebas. La precisión de este estudio fue del 83.2%, lo que es mucho mejor que RasaNLU. Se confirma que el modelo propuesto es más preciso en el campo general. El último experimento compara este estudio con asistentes de voz como Xiao Ai, Google Assistant, Siri y Samsung Bixby. Aunque este estudio no puede responder preguntas vagas con precisión, es más preciso en los campos de aplicación entrenados.