Juegos estocásticos promedio con restricciones de tiempo discreto con procesos de estado independientes
Autores: Zhang, Wenzhao
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Juegos estocásticos promedio con restricciones de tiempo discreto con procesos de estado independientes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Restringido
Juegos estocásticos
Procesos de estado
Cadena de Markov
Equilibrios de Nash
Red inalámbrica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
En este documento, consideramos los juegos estocásticos promedio discretos con restricciones de tiempo con procesos de estado independientes. El espacio de estado de cada jugador es numerable y las funciones de costo de un solo paso pueden ser ilimitadas. En estos modelos de juego, cada jugador elige una acción cada vez que influye en la probabilidad de transición de una cadena de Markov controlada solo por este jugador. Además, cada jugador debe pagar algunos costos que dependen de las acciones de todos los jugadores. Primero, damos una condición de existencia de equilibrios de Nash restringidos estacionarios basados en la técnica de medidas de ocupación promedio y el programa lineal de mejor respuesta. Luego, combinando el programa lineal de mejor respuesta y el programa de dualidad, presentamos un programa matemático no convexo y demostramos que cada equilibrio de Nash estacionario es un minimizador global de este programa matemático. Finalmente, se presenta una red inalámbrica controlada para ilustrar nuestros principales resultados.
Descripción
En este documento, consideramos los juegos estocásticos promedio discretos con restricciones de tiempo con procesos de estado independientes. El espacio de estado de cada jugador es numerable y las funciones de costo de un solo paso pueden ser ilimitadas. En estos modelos de juego, cada jugador elige una acción cada vez que influye en la probabilidad de transición de una cadena de Markov controlada solo por este jugador. Además, cada jugador debe pagar algunos costos que dependen de las acciones de todos los jugadores. Primero, damos una condición de existencia de equilibrios de Nash restringidos estacionarios basados en la técnica de medidas de ocupación promedio y el programa lineal de mejor respuesta. Luego, combinando el programa lineal de mejor respuesta y el programa de dualidad, presentamos un programa matemático no convexo y demostramos que cada equilibrio de Nash estacionario es un minimizador global de este programa matemático. Finalmente, se presenta una red inalámbrica controlada para ilustrar nuestros principales resultados.