Un mecanismo markoviano de asignación proporcional de recursos en el modelo de incentivos como un juego de Stackelberg inverso estocástico dinámico
Autores: Belyavsky, Grigory; Danilova, Natalya; Ougolnitsky, Guennady
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Un mecanismo markoviano de asignación proporcional de recursos en el modelo de incentivos como un juego de Stackelberg inverso estocástico dinámico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Asignación de recursos
Productores
Agentes
Conciencia markoviana
Juego de Stackelberg inverso estocástico
-aprendizaje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Este documento considera la asignación de recursos entre productores (agentes) en el caso en que el Principal no conoce nada sobre sus funciones de costo, mientras que los agentes tienen conciencia markoviana sobre sus estrategias. Utilizamos un escenario dinámico del juego de Stackelberg inverso estocástico como modelo. Sugerimos un algoritmo para resolver este juego basado en Q-learning. Las ecuaciones de Bellman asociadas contienen funciones de una variable para el Principal y también para los agentes. Los nuevos resultados se ilustran con ejemplos numéricos.
Descripción
Este documento considera la asignación de recursos entre productores (agentes) en el caso en que el Principal no conoce nada sobre sus funciones de costo, mientras que los agentes tienen conciencia markoviana sobre sus estrategias. Utilizamos un escenario dinámico del juego de Stackelberg inverso estocástico como modelo. Sugerimos un algoritmo para resolver este juego basado en Q-learning. Las ecuaciones de Bellman asociadas contienen funciones de una variable para el Principal y también para los agentes. Los nuevos resultados se ilustran con ejemplos numéricos.