Análisis Comparativo de Modelos de Lenguaje Generales y Ajustados para Sistemas de Agentes Conversacionales
Autores: Villa, Laura; Carneros-Prado, David; Dobrescu, Cosmin C.; Sánchez-Miguel, Adrián; Cubero, Guillermo; Hervás, Ramón
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Análisis Comparativo de Modelos de Lenguaje Generales y Ajustados para Sistemas de Agentes Conversacionales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Agentes conversacionales
Modelos de Lenguaje Grande
Plataformas de Desarrollo de Chatbots
Modelos GPT-3.5-turbo
Reconocimiento de intenciones y entidades
Capacidades de personalización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 47
Citaciones: Sin citaciones
En el ámbito en rápida evolución de los agentes conversacionales, la integración de Modelos de Lenguaje Grande (LLMs) en las Plataformas de Desarrollo de Chatbots (CDPs) es una innovación significativa. Este estudio compara la eficacia de emplear modelos genéricos y ajustados de GPT-3.5-turbo para diseñar flujos de diálogo, centrándose en el reconocimiento de intenciones y entidades cruciales para interacciones conversacionales dinámicas. Se introducen dos enfoques distintos: un sistema basado en GPT genérico (G-GPT) que aprovecha el modelo preentrenado con prompts complejos para la detección de intenciones y entidades, y un sistema basado en GPT ajustado (FT-GPT) que emplea modelos personalizados para una mayor especificidad y eficiencia. La evaluación abarcó la capacidad de los sistemas para clasificar con precisión las intenciones y reconocer entidades nombradas, contrastando su adaptabilidad, eficiencia operativa y capacidades de personalización. Los resultados revelaron que, si bien el sistema G-GPT ofrece facilidad de implementación y versatilidad en diversos contextos, el sistema FT-GPT demuestra una precisión, eficiencia y personalización superiores, aunque requiere entrenamiento inicial y preparación de conjuntos de datos. Esta investigación destaca la versatilidad de los LLMs en el enriquecimiento de características conversacionales para asistentes hablantes, desde robots sociales hasta chatbots interactivos. Al personalizar estos modelos avanzados, se puede mejorar la fluidez y la capacidad de respuesta de los agentes conversacionales, haciéndolos más adaptables y efectivos en una variedad de entornos, desde el servicio al cliente hasta entornos de aprendizaje interactivo.
Descripción
En el ámbito en rápida evolución de los agentes conversacionales, la integración de Modelos de Lenguaje Grande (LLMs) en las Plataformas de Desarrollo de Chatbots (CDPs) es una innovación significativa. Este estudio compara la eficacia de emplear modelos genéricos y ajustados de GPT-3.5-turbo para diseñar flujos de diálogo, centrándose en el reconocimiento de intenciones y entidades cruciales para interacciones conversacionales dinámicas. Se introducen dos enfoques distintos: un sistema basado en GPT genérico (G-GPT) que aprovecha el modelo preentrenado con prompts complejos para la detección de intenciones y entidades, y un sistema basado en GPT ajustado (FT-GPT) que emplea modelos personalizados para una mayor especificidad y eficiencia. La evaluación abarcó la capacidad de los sistemas para clasificar con precisión las intenciones y reconocer entidades nombradas, contrastando su adaptabilidad, eficiencia operativa y capacidades de personalización. Los resultados revelaron que, si bien el sistema G-GPT ofrece facilidad de implementación y versatilidad en diversos contextos, el sistema FT-GPT demuestra una precisión, eficiencia y personalización superiores, aunque requiere entrenamiento inicial y preparación de conjuntos de datos. Esta investigación destaca la versatilidad de los LLMs en el enriquecimiento de características conversacionales para asistentes hablantes, desde robots sociales hasta chatbots interactivos. Al personalizar estos modelos avanzados, se puede mejorar la fluidez y la capacidad de respuesta de los agentes conversacionales, haciéndolos más adaptables y efectivos en una variedad de entornos, desde el servicio al cliente hasta entornos de aprendizaje interactivo.