Comprensión de Lectura Automática para la Reordenación de Respuestas en Chatbots de Soporte al Cliente
Autores: Hardalov, Momchil; Koychev, Ivan; Nakov, Preslav
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Comprensión de Lectura Automática para la Reordenación de Respuestas en Chatbots de Soporte al Cliente
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Avances
Redes neuronales profundas
Modelado del lenguaje
Generación de lenguaje
Agentes conversacionales
Transformer
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los avances recientes en redes neuronales profundas, modelado de lenguaje y generación de lenguaje han introducido nuevas ideas en el campo de los agentes conversacionales. Como resultado, modelos neuronales profundos como secuencia a secuencia, redes de memoria y el Transformer se han convertido en ingredientes clave de los sistemas de diálogo de última generación. Aunque esos modelos son capaces de generar respuestas significativas incluso en situaciones no vistas, necesitan una gran cantidad de datos de entrenamiento para construir un modelo confiable. Así, la mayoría de los sistemas del mundo real han utilizado enfoques tradicionales basados en recuperación de información (IR) e incluso reglas elaboradas a mano, debido a su robustez y efectividad, especialmente para conversaciones de enfoque estrecho. Aquí, presentamos un método que adapta una arquitectura neuronal profunda del dominio de la comprensión de lectura automática para reordenar las respuestas sugeridas de diferentes modelos utilizando la pregunta como contexto. Entrenamos nuestro modelo utilizando muestreo negativo basado en pares de pregunta-respuesta del Conjunto de Datos de Soporte al Cliente de Twitter. Los resultados experimentales muestran que nuestro marco de reordenamiento puede mejorar el rendimiento en términos de superposición de palabras y semántica tanto para modelos individuales como para combinaciones de modelos.
Descripción
Los avances recientes en redes neuronales profundas, modelado de lenguaje y generación de lenguaje han introducido nuevas ideas en el campo de los agentes conversacionales. Como resultado, modelos neuronales profundos como secuencia a secuencia, redes de memoria y el Transformer se han convertido en ingredientes clave de los sistemas de diálogo de última generación. Aunque esos modelos son capaces de generar respuestas significativas incluso en situaciones no vistas, necesitan una gran cantidad de datos de entrenamiento para construir un modelo confiable. Así, la mayoría de los sistemas del mundo real han utilizado enfoques tradicionales basados en recuperación de información (IR) e incluso reglas elaboradas a mano, debido a su robustez y efectividad, especialmente para conversaciones de enfoque estrecho. Aquí, presentamos un método que adapta una arquitectura neuronal profunda del dominio de la comprensión de lectura automática para reordenar las respuestas sugeridas de diferentes modelos utilizando la pregunta como contexto. Entrenamos nuestro modelo utilizando muestreo negativo basado en pares de pregunta-respuesta del Conjunto de Datos de Soporte al Cliente de Twitter. Los resultados experimentales muestran que nuestro marco de reordenamiento puede mejorar el rendimiento en términos de superposición de palabras y semántica tanto para modelos individuales como para combinaciones de modelos.