Markovian restless bandits y políticas de índices: una revisión
Autores: Niño-Mora, José
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Markovian restless bandits y políticas de índices: una revisión
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Problema del bandido
Asignación de prioridad
Modelos estocásticos
Políticas de índice de prioridad
Desarrollos algorítmicos
Prioridad dinámica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El inquieto problema del bandido multi-brazo es un marco paradigmático de modelado para la asignación óptima de prioridades dinámicas en modelos estocásticos de amplias aplicaciones que ha sido ampliamente investigado y aplicado desde su inicio en un documento seminal de Whittle a finales de la década de 1980. El problema ha generado una vasta y rápida literatura en crecimiento, de la cual una muestra significativa está organizada temáticamente y revisada en este documento. Aunque el enfoque principal está en las políticas de índice de prioridad debido a su atractivo intuitivo, practicidad, propiedades de optimalidad asintótica y a menudo un sólido rendimiento empírico, también se revisan otras líneas de trabajo. Se discuten desarrollos teóricos y algorítmicos, junto con diversas aplicaciones. Los principales objetivos son resaltar la notable amplitud del trabajo que se ha realizado sobre el tema y estimular más investigaciones en el campo.
Descripción
El inquieto problema del bandido multi-brazo es un marco paradigmático de modelado para la asignación óptima de prioridades dinámicas en modelos estocásticos de amplias aplicaciones que ha sido ampliamente investigado y aplicado desde su inicio en un documento seminal de Whittle a finales de la década de 1980. El problema ha generado una vasta y rápida literatura en crecimiento, de la cual una muestra significativa está organizada temáticamente y revisada en este documento. Aunque el enfoque principal está en las políticas de índice de prioridad debido a su atractivo intuitivo, practicidad, propiedades de optimalidad asintótica y a menudo un sólido rendimiento empírico, también se revisan otras líneas de trabajo. Se discuten desarrollos teóricos y algorítmicos, junto con diversas aplicaciones. Los principales objetivos son resaltar la notable amplitud del trabajo que se ha realizado sobre el tema y estimular más investigaciones en el campo.