Mpc-td3 control de seguimiento de trayectoria para vehículos rastreados no tripulados impulsados eléctricamente
Autores: Chen, Yuxuan; Gai, Jiangtao; He, Shuai; Li, Huanhuan; Cheng, Cheng; Zou, Wujun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mpc-td3 control de seguimiento de trayectoria para vehículos rastreados no tripulados impulsados eléctricamente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Seguimiento de trayectoria
Vehículos rastreados no tripulados
Control Predictivo de Modelo
MPC
Gradiente de política determinística profunda con doble retraso
TD3
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Para abordar el problema de seguimiento de trayectoria de vehículos rastreados no tripulados, la mayoría de los estudios emplean el Control Predictivo Basado en Modelo (MPC). El MPC impone altas demandas en la precisión del modelo. Debido a factores como interferencia ambiental, limitaciones del actuador y la no linealidad de los vehículos en condiciones de alta velocidad, los modelos dinámicos y cinemáticos no logran delinear con precisión el proceso de movimiento de los vehículos rastreados. Con el objetivo de abordar el problema de la precisión insuficiente de seguimiento de trayectoria de vehículos rastreados no tripulados, se desarrolla un controlador de seguimiento de trayectoria controlado conjuntamente por el algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3) y el algoritmo MPC. Durante el entrenamiento offline, el agente adquiere las discrepancias entre el modelo y el entorno bajo diversas condiciones de trabajo y optimiza su propia red; durante el razonamiento en línea, el agente compensa de forma adaptativa la salida del MPC basándose en el estado del vehículo. Los resultados experimentales indican que, en comparación con el algoritmo MPC puro, el algoritmo MPC compensado basado en el algoritmo TD3 reduce los errores laterales en un 41.67% y 22.55%, respectivamente, en condiciones de trayectoria de cambio de carril circular y doble.
Descripción
Para abordar el problema de seguimiento de trayectoria de vehículos rastreados no tripulados, la mayoría de los estudios emplean el Control Predictivo Basado en Modelo (MPC). El MPC impone altas demandas en la precisión del modelo. Debido a factores como interferencia ambiental, limitaciones del actuador y la no linealidad de los vehículos en condiciones de alta velocidad, los modelos dinámicos y cinemáticos no logran delinear con precisión el proceso de movimiento de los vehículos rastreados. Con el objetivo de abordar el problema de la precisión insuficiente de seguimiento de trayectoria de vehículos rastreados no tripulados, se desarrolla un controlador de seguimiento de trayectoria controlado conjuntamente por el algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3) y el algoritmo MPC. Durante el entrenamiento offline, el agente adquiere las discrepancias entre el modelo y el entorno bajo diversas condiciones de trabajo y optimiza su propia red; durante el razonamiento en línea, el agente compensa de forma adaptativa la salida del MPC basándose en el estado del vehículo. Los resultados experimentales indican que, en comparación con el algoritmo MPC puro, el algoritmo MPC compensado basado en el algoritmo TD3 reduce los errores laterales en un 41.67% y 22.55%, respectivamente, en condiciones de trayectoria de cambio de carril circular y doble.