logo móvil
Contáctanos

Análisis Comparativo de Modelos de Lenguaje Generales y Ajustados para Sistemas de Agentes Conversacionales

Autores: Villa, Laura; Carneros-Prado, David; Dobrescu, Cosmin C.; Sánchez-Miguel, Adrián; Cubero, Guillermo; Hervás, Ramón

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Análisis Comparativo de Modelos de Lenguaje Generales y Ajustados para Sistemas de Agentes Conversacionales


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Agentes conversacionales
Modelos de Lenguaje Grande
Plataformas de Desarrollo de Chatbots
Modelos GPT-3.5-turbo
Reconocimiento de intenciones y entidades
Capacidades de personalización

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 47

Citaciones: Sin citaciones


Descripción
En el ámbito en rápida evolución de los agentes conversacionales, la integración de Modelos de Lenguaje Grande (LLMs) en las Plataformas de Desarrollo de Chatbots (CDPs) es una innovación significativa. Este estudio compara la eficacia de emplear modelos genéricos y ajustados de GPT-3.5-turbo para diseñar flujos de diálogo, centrándose en el reconocimiento de intenciones y entidades cruciales para interacciones conversacionales dinámicas. Se introducen dos enfoques distintos: un sistema basado en GPT genérico (G-GPT) que aprovecha el modelo preentrenado con prompts complejos para la detección de intenciones y entidades, y un sistema basado en GPT ajustado (FT-GPT) que emplea modelos personalizados para una mayor especificidad y eficiencia. La evaluación abarcó la capacidad de los sistemas para clasificar con precisión las intenciones y reconocer entidades nombradas, contrastando su adaptabilidad, eficiencia operativa y capacidades de personalización. Los resultados revelaron que, si bien el sistema G-GPT ofrece facilidad de implementación y versatilidad en diversos contextos, el sistema FT-GPT demuestra una precisión, eficiencia y personalización superiores, aunque requiere entrenamiento inicial y preparación de conjuntos de datos. Esta investigación destaca la versatilidad de los LLMs en el enriquecimiento de características conversacionales para asistentes hablantes, desde robots sociales hasta chatbots interactivos. Al personalizar estos modelos avanzados, se puede mejorar la fluidez y la capacidad de respuesta de los agentes conversacionales, haciéndolos más adaptables y efectivos en una variedad de entornos, desde el servicio al cliente hasta entornos de aprendizaje interactivo.

Otros recursos que podrían interesarte

Temas Virtualpro