Control adaptable de cuadricópteros en entornos inciertos
Autores: Leitão, Daniel; Cunha, Rita; Lemos, João M.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Control adaptable de cuadricópteros en entornos inciertos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería General
Palabras clave
Control de movimiento
Cuadricóptero
Control adaptativo
Aprendizaje por refuerzo
Incertidumbres
Simulación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El problema abordado en este artículo consiste en el control de movimiento de un cuadricóptero afectado por perturbaciones y incertidumbres en el modelo. Para abordar la incertidumbre del modelo, se utiliza un control adaptativo basado en aprendizaje por refuerzo. La característica distintiva de este artículo, en comparación con otros trabajos sobre control de cuadricópteros utilizando aprendizaje por refuerzo, es la exploración del problema de control óptimo subyacente en el que un costo cuadrático y una dinámica lineal permiten un algoritmo que se ejecuta en tiempo real. En lugar de identificar un modelo de planta, la adaptación se obtiene aproximando el índice de rendimiento dado por la función Q utilizando cuadrados mínimos recursivos de olvido direccional que se basan en un regresor lineal construido a partir de funciones cuadráticas de datos de entrada/salida. El algoritmo adaptativo propuesto se prueba en simulación en una estructura de control en cascada que dirige un cuadricóptero. Las simulaciones muestran la mejora en el rendimiento que resulta cuando se activa el algoritmo propuesto.
Descripción
El problema abordado en este artículo consiste en el control de movimiento de un cuadricóptero afectado por perturbaciones y incertidumbres en el modelo. Para abordar la incertidumbre del modelo, se utiliza un control adaptativo basado en aprendizaje por refuerzo. La característica distintiva de este artículo, en comparación con otros trabajos sobre control de cuadricópteros utilizando aprendizaje por refuerzo, es la exploración del problema de control óptimo subyacente en el que un costo cuadrático y una dinámica lineal permiten un algoritmo que se ejecuta en tiempo real. En lugar de identificar un modelo de planta, la adaptación se obtiene aproximando el índice de rendimiento dado por la función Q utilizando cuadrados mínimos recursivos de olvido direccional que se basan en un regresor lineal construido a partir de funciones cuadráticas de datos de entrada/salida. El algoritmo adaptativo propuesto se prueba en simulación en una estructura de control en cascada que dirige un cuadricóptero. Las simulaciones muestran la mejora en el rendimiento que resulta cuando se activa el algoritmo propuesto.