Control de Aprendizaje por Refuerzo Adaptativo en Tiempo Finito para una Clase de Aeronaves No Tripuladas con Transformación con Perturbaciones Desajustadas e Incertidumbres Acopladas
Autores: Ren, Wei; Wei, Yingjie; Wang, Cong; Wang, Zheng
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Control de Aprendizaje por Refuerzo Adaptativo en Tiempo Finito para una Clase de Aeronaves No Tripuladas con Transformación con Perturbaciones Desajustadas e Incertidumbres Acopladas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Propone
Aprendizaje por refuerzo adaptativo en tiempo finito
Ley de control
Aeronaves no tripuladas que cambian de forma
Incertidumbres
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento propone una ley de control de refuerzo adaptativo (RL) en tiempo finito para una clase de aeronaves no tripuladas en transformación con perturbaciones desajustadas e incertidumbres acopladas. Para manejar las perturbaciones desajustadas, se ha propuesto un estimador adaptativo de límite superior, así como las leyes de adaptación de parámetros. Con el objetivo de abordar las incertidumbres acopladas, se ha desarrollado un estimador de incertidumbre en línea basado en RL y una ley de control de compensación en tiempo finito correspondiente. Para tratar las características no afines, se ha introducido un sistema integral auxiliar. Al integrar sistemáticamente los mencionados estimadores adaptativos de límite superior, la ley de control en tiempo finito y las señales auxiliares, se construye un novedoso marco de control adaptativo en tiempo finito basado en RL para aeronaves no tripuladas en transformación. Los resultados de simulación revelan la convergencia en tiempo finito y las ventajas del método propuesto.
Descripción
Este documento propone una ley de control de refuerzo adaptativo (RL) en tiempo finito para una clase de aeronaves no tripuladas en transformación con perturbaciones desajustadas e incertidumbres acopladas. Para manejar las perturbaciones desajustadas, se ha propuesto un estimador adaptativo de límite superior, así como las leyes de adaptación de parámetros. Con el objetivo de abordar las incertidumbres acopladas, se ha desarrollado un estimador de incertidumbre en línea basado en RL y una ley de control de compensación en tiempo finito correspondiente. Para tratar las características no afines, se ha introducido un sistema integral auxiliar. Al integrar sistemáticamente los mencionados estimadores adaptativos de límite superior, la ley de control en tiempo finito y las señales auxiliares, se construye un novedoso marco de control adaptativo en tiempo finito basado en RL para aeronaves no tripuladas en transformación. Los resultados de simulación revelan la convergencia en tiempo finito y las ventajas del método propuesto.