Aprendizaje en Línea Asincrónico de Tiempo Real Suave a partir de Datos de Entrada-Salida para el Control de Referencia de Modelo de UAV Bajo Dinámicas Inciertas y Actuación Defectuosa
Autores: Radac, Mircea-Bogdan
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Aprendizaje en Línea Asincrónico de Tiempo Real Suave a partir de Datos de Entrada-Salida para el Control de Referencia de Modelo de UAV Bajo Dinámicas Inciertas y Actuación Defectuosa
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
En línea
Fuera de política
Asincrónico
En tiempo real
Control de seguimiento de referencia de modelo
UAVs
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Se propone y valida un algoritmo de control de seguimiento de referencia de modelo en tiempo real asíncrono fuera de política (OOART-MRTC) para vehículos aéreos no tripulados (UAV) caracterizados por una actuación defectuosa y una incertidumbre paramétrica. El problema de control óptimo se plantea basado en programación dinámica aproximada (ADP) y teoría de aprendizaje por refuerzo (RL), utilizando una representación de espacio de estados virtual construida exclusivamente sobre datos verdaderos del sistema de entrada-salida, que explota la teoría de observabilidad. OOART-MRTC aprende el control interactuando con el sistema, comenzando desde un controlador estabilizador inicial derivado de un modelo incierto aproximado. Se analizan la convergencia del aprendizaje y la estabilidad bajo el comportamiento adaptativo propuesto. Dado que las iteraciones de aprendizaje no pueden actualizarse dentro de un período de muestreo, se propone un mecanismo asíncrono para actualizar los parámetros del controlador, aprovechando el control en tiempo real y la multitarea. La complejidad asociada con el sistema de alta dimensión resultante se resuelve mediante una parametrización lineal eficiente y se valida en un estudio de caso realista donde tres integradores dobles acoplados describen el control de actitud del UAV.
Descripción
Se propone y valida un algoritmo de control de seguimiento de referencia de modelo en tiempo real asíncrono fuera de política (OOART-MRTC) para vehículos aéreos no tripulados (UAV) caracterizados por una actuación defectuosa y una incertidumbre paramétrica. El problema de control óptimo se plantea basado en programación dinámica aproximada (ADP) y teoría de aprendizaje por refuerzo (RL), utilizando una representación de espacio de estados virtual construida exclusivamente sobre datos verdaderos del sistema de entrada-salida, que explota la teoría de observabilidad. OOART-MRTC aprende el control interactuando con el sistema, comenzando desde un controlador estabilizador inicial derivado de un modelo incierto aproximado. Se analizan la convergencia del aprendizaje y la estabilidad bajo el comportamiento adaptativo propuesto. Dado que las iteraciones de aprendizaje no pueden actualizarse dentro de un período de muestreo, se propone un mecanismo asíncrono para actualizar los parámetros del controlador, aprovechando el control en tiempo real y la multitarea. La complejidad asociada con el sistema de alta dimensión resultante se resuelve mediante una parametrización lineal eficiente y se valida en un estudio de caso realista donde tres integradores dobles acoplados describen el control de actitud del UAV.