Control de Modo Deslizante en Tiempo Finito Basado en Aprendizaje por Refuerzo en un Marco de Trabajo con Humano en el Ciclo para Exoesqueleto de Marcha Pediátrico
Autores: Wong Sang, Matthew; Narayan, Jyotindra
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Control de Modo Deslizante en Tiempo Finito Basado en Aprendizaje por Refuerzo en un Marco de Trabajo con Humano en el Ciclo para Exoesqueleto de Marcha Pediátrico
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Dispositivos de rehabilitación
Exoesqueletos de extremidades inferiores
Pacientes pediátricos
Sistemas de control
Discapacidades en la marcha
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Los dispositivos de rehabilitación, como los exoesqueletos actuados de extremidades inferiores, pueden proporcionar asistencia esencial para la movilidad de pacientes pediátricos con discapacidades en la marcha. Mejorar sus sistemas de control en condiciones de variabilidad del usuario y perturbaciones dinámicas sigue siendo un desafío significativo, particularmente en modos de asistencia activa. Este estudio presenta una arquitectura de control con un humano en el circuito para un exoesqueleto pediátrico de extremidades inferiores, combinando control de admisión de lazo externo con seguimiento robusto de trayectoria de lazo interno a través de un controlador de modo deslizante terminal no singular (NSTSM). Diseñado para la rehabilitación de la marcha en niños de 8 a 12 años, el exoesqueleto responde dinámicamente a las fuerzas de interacción del usuario mientras asegura una convergencia en tiempo finito bajo incertidumbres del sistema. Para mejorar la adaptabilidad, aumentamos el control de lazo interno con un marco de aprendizaje por refuerzo de gradiente determinista profundo con doble retardo (TD3). El agente de RL actor-crítico ajusta las ganancias de NSTSM en tiempo real, permitiendo una adaptación personalizada sin modelo a la dinámica de marcha específica del sujeto y a las perturbaciones externas. Las simulaciones numéricas muestran una mejora en el seguimiento de trayectoria, con reducciones de RMSE del 27.82% (cadera) y del 5.43% (rodilla), y mejoras de IAE del 40.85% y del 10.20%, respectivamente, en comparación con el controlador NSTSM base. El enfoque propuesto también redujo los torques de interacción máximos en todas las articulaciones, sugiriendo una asistencia más compliant y cómoda para los usuarios. Aunque se observa una ligera degradación en la articulación del tobillo, el controlador TD3-NSTSM demuestra una mejor capacidad de respuesta y estabilidad, particularmente en articulaciones de alta carga. Esta investigación contribuye al avance de la rehabilitación de la marcha pediátrica utilizando control mejorado por RL, ofreciendo un mejor apoyo a la movilidad y resultados de rehabilitación adaptativos.
Descripción
Los dispositivos de rehabilitación, como los exoesqueletos actuados de extremidades inferiores, pueden proporcionar asistencia esencial para la movilidad de pacientes pediátricos con discapacidades en la marcha. Mejorar sus sistemas de control en condiciones de variabilidad del usuario y perturbaciones dinámicas sigue siendo un desafío significativo, particularmente en modos de asistencia activa. Este estudio presenta una arquitectura de control con un humano en el circuito para un exoesqueleto pediátrico de extremidades inferiores, combinando control de admisión de lazo externo con seguimiento robusto de trayectoria de lazo interno a través de un controlador de modo deslizante terminal no singular (NSTSM). Diseñado para la rehabilitación de la marcha en niños de 8 a 12 años, el exoesqueleto responde dinámicamente a las fuerzas de interacción del usuario mientras asegura una convergencia en tiempo finito bajo incertidumbres del sistema. Para mejorar la adaptabilidad, aumentamos el control de lazo interno con un marco de aprendizaje por refuerzo de gradiente determinista profundo con doble retardo (TD3). El agente de RL actor-crítico ajusta las ganancias de NSTSM en tiempo real, permitiendo una adaptación personalizada sin modelo a la dinámica de marcha específica del sujeto y a las perturbaciones externas. Las simulaciones numéricas muestran una mejora en el seguimiento de trayectoria, con reducciones de RMSE del 27.82% (cadera) y del 5.43% (rodilla), y mejoras de IAE del 40.85% y del 10.20%, respectivamente, en comparación con el controlador NSTSM base. El enfoque propuesto también redujo los torques de interacción máximos en todas las articulaciones, sugiriendo una asistencia más compliant y cómoda para los usuarios. Aunque se observa una ligera degradación en la articulación del tobillo, el controlador TD3-NSTSM demuestra una mejor capacidad de respuesta y estabilidad, particularmente en articulaciones de alta carga. Esta investigación contribuye al avance de la rehabilitación de la marcha pediátrica utilizando control mejorado por RL, ofreciendo un mejor apoyo a la movilidad y resultados de rehabilitación adaptativos.