Un marco novedoso de aprendizaje profundo basado en refuerzo para ajuste de la marcha
Autores: Li, Ang; Chen, Jianping; Fu, Qiming; Wu, Hongjie; Wang, Yunzhe; Lu, You
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un marco novedoso de aprendizaje profundo basado en refuerzo para ajuste de la marcha
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Millones de pacientes con discapacidades físicas se beneficiarán de un exoesqueleto de miembros inferiores con métodos de control inteligente mediante el aprendizaje profundo por refuerzo.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Hoy en día, millones de pacientes sufren de discapacidades físicas, incluidas las discapacidades de las extremidades inferiores. Los investigadores han adoptado una variedad de terapias físicas basadas en el exoesqueleto de las extremidades inferiores, en las cuales es difícil ajustar los parámetros del equipo de manera oportuna. Por lo tanto, se han utilizado métodos de control inteligente, como el aprendizaje profundo por refuerzo (DRL), para controlar el equipo médico utilizado en el ajuste de la marcha humana. En este estudio, basado en el mecanismo de atención clave-valor, reconstruimos las observaciones del agente capturando la información de características auto-dependientes para la toma de decisiones con respecto a cada estado muestreado del búfer de repetición. Además, basándonos en los gradientes de políticas deterministas dobles profundos Softmax (SD3), se ha propuesto un marco novedoso basado en DRL, SD3 basado en atención clave-valor (AT_SD3), para el ajuste de la marcha. Demostramos la efectividad de nuestro marco propuesto en el ajuste de la marcha al comparar diferentes trayectorias de marcha, incluida la trayectoria deseada y la trayectoria ajustada. Los resultados mostraron que las trayectorias simuladas estaban más cerca de la trayectoria deseada, tanto en sus formas como en sus valores. Además, al comparar los resultados de nuestros experimentos con los de otros métodos de vanguardia, los resultados demostraron que nuestro marco propuesto exhibió un mejor rendimiento.
Descripción
Hoy en día, millones de pacientes sufren de discapacidades físicas, incluidas las discapacidades de las extremidades inferiores. Los investigadores han adoptado una variedad de terapias físicas basadas en el exoesqueleto de las extremidades inferiores, en las cuales es difícil ajustar los parámetros del equipo de manera oportuna. Por lo tanto, se han utilizado métodos de control inteligente, como el aprendizaje profundo por refuerzo (DRL), para controlar el equipo médico utilizado en el ajuste de la marcha humana. En este estudio, basado en el mecanismo de atención clave-valor, reconstruimos las observaciones del agente capturando la información de características auto-dependientes para la toma de decisiones con respecto a cada estado muestreado del búfer de repetición. Además, basándonos en los gradientes de políticas deterministas dobles profundos Softmax (SD3), se ha propuesto un marco novedoso basado en DRL, SD3 basado en atención clave-valor (AT_SD3), para el ajuste de la marcha. Demostramos la efectividad de nuestro marco propuesto en el ajuste de la marcha al comparar diferentes trayectorias de marcha, incluida la trayectoria deseada y la trayectoria ajustada. Los resultados mostraron que las trayectorias simuladas estaban más cerca de la trayectoria deseada, tanto en sus formas como en sus valores. Además, al comparar los resultados de nuestros experimentos con los de otros métodos de vanguardia, los resultados demostraron que nuestro marco propuesto exhibió un mejor rendimiento.