Enrutamiento de Conversación Interpretable a través del Enfoque de Incrustaciones Latentes
Autores: Maksymenko, Daniil; Turuta, Oleksii
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Enrutamiento de Conversación Interpretable a través del Enfoque de Incrustaciones Latentes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Modelos de lenguaje grandes
Automatizar la experiencia del cliente
Casos de uso médico
Enrutamiento de conversaciones
Recuperación de incrustaciones latentes
Enfoques interpretables de pocas tomas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Los grandes modelos de lenguaje (LLMs) se implementan rápidamente para responder preguntas y respaldar sistemas que automatizan la experiencia del cliente en todos los dominios, incluidos los casos de uso médico. Los modelos en tales entornos deben resolver múltiples problemas como preguntas de conocimiento general, consultas a fuentes externas, llamadas de funciones y muchos otros. Algunos casos podrían no requerir ni siquiera generación completa de texto. Posiblemente necesiten diferentes indicaciones o incluso diferentes modelos. Todo esto puede ser gestionado por un paso de enrutamiento. Este documento se centra en enfoques interpretables de pocos disparos para el enrutamiento de conversaciones como la recuperación de incrustaciones latentes. El trabajo aquí presenta un punto de referencia, un análisis de pesar y un conjunto de visualizaciones de cómo funciona el enrutamiento de incrustaciones latentes para conversaciones de largo contexto en un entorno multilingüe y específico de dominio. Los resultados presentados aquí muestran que el enrutador de incrustaciones latentes es capaz de lograr un rendimiento al mismo nivel que los enrutadores basados en LLM con interpretabilidad adicional y un mayor nivel de control sobre la toma de decisiones del modelo.
Descripción
Los grandes modelos de lenguaje (LLMs) se implementan rápidamente para responder preguntas y respaldar sistemas que automatizan la experiencia del cliente en todos los dominios, incluidos los casos de uso médico. Los modelos en tales entornos deben resolver múltiples problemas como preguntas de conocimiento general, consultas a fuentes externas, llamadas de funciones y muchos otros. Algunos casos podrían no requerir ni siquiera generación completa de texto. Posiblemente necesiten diferentes indicaciones o incluso diferentes modelos. Todo esto puede ser gestionado por un paso de enrutamiento. Este documento se centra en enfoques interpretables de pocos disparos para el enrutamiento de conversaciones como la recuperación de incrustaciones latentes. El trabajo aquí presenta un punto de referencia, un análisis de pesar y un conjunto de visualizaciones de cómo funciona el enrutamiento de incrustaciones latentes para conversaciones de largo contexto en un entorno multilingüe y específico de dominio. Los resultados presentados aquí muestran que el enrutador de incrustaciones latentes es capaz de lograr un rendimiento al mismo nivel que los enrutadores basados en LLM con interpretabilidad adicional y un mayor nivel de control sobre la toma de decisiones del modelo.