Mejorando la Generación de Diálogo en Chino con Embedding de Fusión de Palabras y Frases y Optimización Sparse SoftMax

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Mejorando la Generación de Diálogo en Chino con Embedding de Fusión de Palabras y Frases y Optimización Sparse SoftMax

Autores: Lv, Shenrong; Lu, Siyu; Wang, Ruiyang; Yin, Lirong; Yin, Zhengtong; A. AlQahtani, Salman; Tian, Jiawei; Zheng, Wenfeng

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Mejorando la Generación de Diálogo en Chino con Embedding de Fusión de Palabras y Frases y Optimización Sparse SoftMax

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Desafíos

Generación de diálogos en chino

Arquitectura de transformadores

Incrustaciones de palabras

Softmax disperso

Métricas de evaluación automática

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones

La generación de diálogos en chino enfrenta múltiples desafíos, como la comprensión semántica, la coincidencia de información y la fluidez de las respuestas. Los sistemas de diálogo generativos para la conversación en chino son algo difíciles de construir debido al orden flexible de las palabras, el gran impacto del reemplazo de palabras en la semántica y el complejo contexto implícito. Los métodos existentes aún tienen limitaciones para abordar estos problemas. Para enfrentar estos desafíos, este artículo propone un modelo mejorado de generación de diálogos en chino basado en la arquitectura transformer. El modelo utiliza un decodificador transformer de múltiples capas como columna vertebral e introduce dos técnicas clave, a saber, la incorporación de incrustaciones de palabras de modelos de lenguaje preentrenados y la optimización de la función de pérdida Softmax dispersa. Para la fusión de incrustaciones de palabras, concatenamos los vectores de palabras del modelo preentrenado con incrustaciones basadas en caracteres para mejorar la información semántica de las representaciones de palabras. La optimización de Softmax disperso mitiga efectivamente el problema del sobreajuste al introducir un término de regularización de escasez. Los resultados experimentales en el conjunto de datos de conversación de texto corto en chino (STC) demuestran que nuestro modelo propuesto supera significativamente a los modelos base en métricas de evaluación automática, como BLEU y Distinct, con una mejora promedio de 3.5 puntos porcentuales. Las evaluaciones humanas también validan la superioridad de nuestro modelo en la generación de respuestas fluidas y relevantes. Este trabajo proporciona nuevas ideas y soluciones para construir sistemas de diálogo en chino más inteligentes y similares a los humanos.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro