Manipulador robótico en entorno dinámico con mecanismo de atención combinando SAC y LSTM
Autores: Kuang, Xinghong; Zhou, Sucheng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Manipulador robótico en entorno dinámico con mecanismo de atención combinando SAC y LSTM
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Manipulador
Entorno dinámico
Algoritmo Soft Actor Critic
Distancia euclidiana
Memoria a Corto y Largo Plazo
Red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
La tarea de planificación de movimiento del manipulador en un entorno dinámico es relativamente compleja. Este documento utiliza el Algoritmo Soft Actor Critic (SAC) mejorado con la ventaja de entropía máxima como algoritmo de referencia para implementar la planificación de movimiento del manipulador. Con el fin de resolver el problema de la insuficiente robustez en entornos dinámicos y la dificultad para adaptarse a cambios ambientales, se propone combinar la distancia euclidiana y la diferencia de distancia para mejorar la precisión al acercarse al objetivo. Además, para resolver el problema de no estabilidad e incertidumbre del estado de entrada en el entorno dinámico, que conduce a la incapacidad de expresar completamente la información del estado, proponemos una red de atención fusionada con Memoria a Corto y Largo Plazo (LSTM) para mejorar el algoritmo SAC. Realizamos experimentos de simulación y presentamos los resultados experimentales. Los resultados demuestran que el uso de funciones de red neuronal fusionadas mejoró la tasa de éxito al acercarse al objetivo y mejoró el algoritmo SAC al mismo tiempo, lo que mejoró la velocidad de convergencia, la tasa de éxito y las capacidades de evitación del algoritmo.
Descripción
La tarea de planificación de movimiento del manipulador en un entorno dinámico es relativamente compleja. Este documento utiliza el Algoritmo Soft Actor Critic (SAC) mejorado con la ventaja de entropía máxima como algoritmo de referencia para implementar la planificación de movimiento del manipulador. Con el fin de resolver el problema de la insuficiente robustez en entornos dinámicos y la dificultad para adaptarse a cambios ambientales, se propone combinar la distancia euclidiana y la diferencia de distancia para mejorar la precisión al acercarse al objetivo. Además, para resolver el problema de no estabilidad e incertidumbre del estado de entrada en el entorno dinámico, que conduce a la incapacidad de expresar completamente la información del estado, proponemos una red de atención fusionada con Memoria a Corto y Largo Plazo (LSTM) para mejorar el algoritmo SAC. Realizamos experimentos de simulación y presentamos los resultados experimentales. Los resultados demuestran que el uso de funciones de red neuronal fusionadas mejoró la tasa de éxito al acercarse al objetivo y mejoró el algoritmo SAC al mismo tiempo, lo que mejoró la velocidad de convergencia, la tasa de éxito y las capacidades de evitación del algoritmo.