Propagación de Incertidumbre Eficiente en Aprendizaje por Refuerzo Basado en Modelos de Vehículo de Superficie No Tripulado Usando Filtro de Kalman Sin Aroma
Autores: Wang, Jincheng; Xia, Lei; Peng, Lei; Li, Huiyun; Cui, Yunduan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Propagación de Incertidumbre Eficiente en Aprendizaje por Refuerzo Basado en Modelos de Vehículo de Superficie No Tripulado Usando Filtro de Kalman Sin Aroma
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Carga computacional
Incertidumbres
Controlador predictivo de modelo
Aprendizaje por refuerzo basado en modelos probabilísticos
Filtro de Kalman sin olor
USV.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este artículo aborda la carga computacional de propagar incertidumbres en la política basada en controladores predictivos de modelos del sistema de aprendizaje por refuerzo basado en modelos probabilísticos (MBRL) para un sistema de vehículos de superficie no tripulados (USV). Proponemos un control predictivo de modelos probabilísticos filtrados utilizando el filtro de Kalman sin ruido (FPMPC-UKF), que introduce el filtro de Kalman sin ruido (UKF) para una propagación de incertidumbre más eficiente en MBRL. Se desarrolla y evalúa un sistema de control de USV basado en FPMPC-UKF mediante tareas de mantenimiento de posición y alcance de objetivos en una simulación real de USV impulsada por datos. Los resultados experimentales demuestran una superioridad significativa del método propuesto en el equilibrio entre el rendimiento del control y las cargas computacionales bajo diferentes niveles de perturbaciones en comparación con los trabajos relacionados de USV, y por lo tanto indican su potencial en escenarios de USV más desafiantes con recursos computacionales limitados.
Descripción
Este artículo aborda la carga computacional de propagar incertidumbres en la política basada en controladores predictivos de modelos del sistema de aprendizaje por refuerzo basado en modelos probabilísticos (MBRL) para un sistema de vehículos de superficie no tripulados (USV). Proponemos un control predictivo de modelos probabilísticos filtrados utilizando el filtro de Kalman sin ruido (FPMPC-UKF), que introduce el filtro de Kalman sin ruido (UKF) para una propagación de incertidumbre más eficiente en MBRL. Se desarrolla y evalúa un sistema de control de USV basado en FPMPC-UKF mediante tareas de mantenimiento de posición y alcance de objetivos en una simulación real de USV impulsada por datos. Los resultados experimentales demuestran una superioridad significativa del método propuesto en el equilibrio entre el rendimiento del control y las cargas computacionales bajo diferentes niveles de perturbaciones en comparación con los trabajos relacionados de USV, y por lo tanto indican su potencial en escenarios de USV más desafiantes con recursos computacionales limitados.