ILSTMA: Mejorando la Precisión y Velocidad de la Arquitectura de Memoria a Largo Plazo y a Corto Plazo
Autores: Ming, Zongyu; Wu, Zimu; Chen, Genlang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
ILSTMA: Mejorando la Precisión y Velocidad de la Arquitectura de Memoria a Largo Plazo y a Corto Plazo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Desarrollo
Memoria a largo plazo
Memoria a corto plazo
ILSTMA
Algoritmos de recuperación de memoria
Precisión de las respuestas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, el rápido desarrollo de los modelos de lenguaje grandes (LLMs) ha llevado a un creciente consenso en la industria sobre la integración de la memoria a largo y corto plazo. Sin embargo, la aplicación generalizada de los sistemas de memoria a largo y corto plazo enfrenta dos desafíos significativos: el aumento del tiempo de ejecución y la disminución de la precisión de las respuestas de los LLMs. Para abordar estos desafíos, proponemos el ILSTMA. Esta arquitectura combina de manera única teorías fundamentales del olvido humano con principios clásicos de sistemas operativos, proporcionando un método de aceleración sin precedentes que no depende de algoritmos tradicionales de recuperación de memoria, todo basado en la planificación sistemática del espacio de memoria disponible. Además, nuestro proceso de recuperación de diálogos más relevantes mejora sustancialmente la precisión de las respuestas de los LLMs mientras examina el potencial de los dos algoritmos de recuperación de memoria más comúnmente utilizados. Los resultados experimentales demuestran que nuestro método de aceleración mejora la eficiencia de ejecución de la arquitectura original en un 21.45%, y nuestro proceso de recuperación de diálogos más relevantes eleva la precisión de las respuestas al 88.4%, superando varios puntos de referencia. Estos hallazgos validan el alto rendimiento del ILSTMA.
Descripción
En los últimos años, el rápido desarrollo de los modelos de lenguaje grandes (LLMs) ha llevado a un creciente consenso en la industria sobre la integración de la memoria a largo y corto plazo. Sin embargo, la aplicación generalizada de los sistemas de memoria a largo y corto plazo enfrenta dos desafíos significativos: el aumento del tiempo de ejecución y la disminución de la precisión de las respuestas de los LLMs. Para abordar estos desafíos, proponemos el ILSTMA. Esta arquitectura combina de manera única teorías fundamentales del olvido humano con principios clásicos de sistemas operativos, proporcionando un método de aceleración sin precedentes que no depende de algoritmos tradicionales de recuperación de memoria, todo basado en la planificación sistemática del espacio de memoria disponible. Además, nuestro proceso de recuperación de diálogos más relevantes mejora sustancialmente la precisión de las respuestas de los LLMs mientras examina el potencial de los dos algoritmos de recuperación de memoria más comúnmente utilizados. Los resultados experimentales demuestran que nuestro método de aceleración mejora la eficiencia de ejecución de la arquitectura original en un 21.45%, y nuestro proceso de recuperación de diálogos más relevantes eleva la precisión de las respuestas al 88.4%, superando varios puntos de referencia. Estos hallazgos validan el alto rendimiento del ILSTMA.