Un modelo teórico de juegos para un problema de seguimiento cuadrático lineal estocástico
Autores: Drgan, Vasile; Ivanov, Ivan Ganchev; Popa, Ioan-Lucian
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un modelo teórico de juegos para un problema de seguimiento cuadrático lineal estocástico
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Problema de seguimiento cuadrático lineal estocástico
Sistema dinámico controlado
Estrategia de equilibrio de Nash
Salida preferencial
Ecuaciones diferenciales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
En este documento, resolvemos un problema de seguimiento estocástico cuadrático lineal. El sistema dinámico controlado está modelado por un sistema de ecuaciones diferenciales lineales de Itô sujeto a perturbaciones de salto Markov. Consideramos el caso en el que hay dos tomadores de decisiones y cada uno de ellos desea minimizar la desviación de una salida preferencial del sistema dinámico controlado respecto a una señal de referencia dada. Suponemos que los dos tomadores de decisiones no cooperan. Bajo estas condiciones, planteamos el problema de seguimiento considerado como un problema de encontrar una estrategia de equilibrio de Nash para un juego diferencial estocástico. Se proporcionan fórmulas explícitas de una estrategia de equilibrio de Nash. Para ello, utilizamos las soluciones de dos problemas de valor terminal (TVPs) dados. El primer TVP está asociado con un sistema híbrido formado por dos ecuaciones diferenciales no lineales hacia atrás acopladas por dos ecuaciones no lineales algebraicas. El segundo TVP está asociado con un sistema híbrido formado por dos ecuaciones diferenciales lineales hacia atrás acopladas por dos ecuaciones lineales algebraicas.
Descripción
En este documento, resolvemos un problema de seguimiento estocástico cuadrático lineal. El sistema dinámico controlado está modelado por un sistema de ecuaciones diferenciales lineales de Itô sujeto a perturbaciones de salto Markov. Consideramos el caso en el que hay dos tomadores de decisiones y cada uno de ellos desea minimizar la desviación de una salida preferencial del sistema dinámico controlado respecto a una señal de referencia dada. Suponemos que los dos tomadores de decisiones no cooperan. Bajo estas condiciones, planteamos el problema de seguimiento considerado como un problema de encontrar una estrategia de equilibrio de Nash para un juego diferencial estocástico. Se proporcionan fórmulas explícitas de una estrategia de equilibrio de Nash. Para ello, utilizamos las soluciones de dos problemas de valor terminal (TVPs) dados. El primer TVP está asociado con un sistema híbrido formado por dos ecuaciones diferenciales no lineales hacia atrás acopladas por dos ecuaciones no lineales algebraicas. El segundo TVP está asociado con un sistema híbrido formado por dos ecuaciones diferenciales lineales hacia atrás acopladas por dos ecuaciones lineales algebraicas.