Optimización de control estocástico lineal-cuadrático restringido en un horizonte infinito: un enfoque basado en comparación directa
Autores: Xue, Ruobing; Ye, Xiangshen; Wu, Weiping
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Optimización de control estocástico lineal-cuadrático restringido en un horizonte infinito: un enfoque basado en comparación directa
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Optimización
Control estocástico
Lineal-cuadrático
Restricciones de control cónico
Horizonte infinito
Enfoque de comparación directa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
En este trabajo estudiamos la optimización del problema de control lineal-cuadrático estocástico discreto en tiempo discreto con restricciones de control cónicas en un horizonte infinito, considerando ruidos multiplicativos. Los sistemas de control estocástico pueden formularse como Problemas de Decisión de Markov (MDPs) con espacios de estados continuos y, por lo tanto, podemos aplicar el enfoque de optimización basado en la comparación directa para resolver el problema. Primero derivamos la fórmula de diferencia de rendimiento para el problema LQ utilizando la propiedad de separación de estados de la estructura del sistema. Con base en esto, derivamos con éxito las condiciones de optimalidad y el control óptimo estacionario de retroalimentación. Al introducir la optimización, establecemos un marco general para problemas de control estocástico de horizonte infinito. El enfoque basado en la comparación directa es aplicable tanto a sistemas lineales como no lineales. Nuestro trabajo proporciona una nueva perspectiva en problemas de control LQ; basándonos en este enfoque, se pueden desarrollar algoritmos basados en el aprendizaje sin identificar todos los parámetros del sistema.
Descripción
En este trabajo estudiamos la optimización del problema de control lineal-cuadrático estocástico discreto en tiempo discreto con restricciones de control cónicas en un horizonte infinito, considerando ruidos multiplicativos. Los sistemas de control estocástico pueden formularse como Problemas de Decisión de Markov (MDPs) con espacios de estados continuos y, por lo tanto, podemos aplicar el enfoque de optimización basado en la comparación directa para resolver el problema. Primero derivamos la fórmula de diferencia de rendimiento para el problema LQ utilizando la propiedad de separación de estados de la estructura del sistema. Con base en esto, derivamos con éxito las condiciones de optimalidad y el control óptimo estacionario de retroalimentación. Al introducir la optimización, establecemos un marco general para problemas de control estocástico de horizonte infinito. El enfoque basado en la comparación directa es aplicable tanto a sistemas lineales como no lineales. Nuestro trabajo proporciona una nueva perspectiva en problemas de control LQ; basándonos en este enfoque, se pueden desarrollar algoritmos basados en el aprendizaje sin identificar todos los parámetros del sistema.