Un algoritmo para tomar decisiones markovianas que cambian de régimen
Autores: Hinz, Juri
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un algoritmo para tomar decisiones markovianas que cambian de régimen
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Toma de decisiones secuenciales
Teoría de decisiones de Markov
Información incompleta
Cambio de régimen
Probabilidades de transición
Algoritmos numéricos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
En aplicaciones industriales, los procesos de toma de decisiones secuenciales óptimas se formulan y optimizan de forma natural dentro de un marco estándar de la teoría de decisiones de Markov. Sin embargo, en la práctica, las decisiones deben tomarse bajo información incompleta e incierta sobre parámetros y probabilidades de transición. Esta situación ocurre cuando un sistema puede sufrir un cambio de régimen que modifica no solo las probabilidades de transición, sino también los costos de control. Después de dicho evento, el efecto de las acciones puede volverse contrario, lo que significa que todas las estrategias deben ser revisadas. Debido a la importancia práctica de este problema, se han sugerido una variedad de métodos, que van desde la incorporación de cambios de régimen en la dinámica de Markov hasta numerosos conceptos que abordan la incertidumbre del modelo. En este trabajo, sugerimos un enfoque pragmático y práctico utilizando una reformulación natural de este problema como un sistema de cambio convexo, lo que permite aplicar algoritmos numéricos eficientes.
Descripción
En aplicaciones industriales, los procesos de toma de decisiones secuenciales óptimas se formulan y optimizan de forma natural dentro de un marco estándar de la teoría de decisiones de Markov. Sin embargo, en la práctica, las decisiones deben tomarse bajo información incompleta e incierta sobre parámetros y probabilidades de transición. Esta situación ocurre cuando un sistema puede sufrir un cambio de régimen que modifica no solo las probabilidades de transición, sino también los costos de control. Después de dicho evento, el efecto de las acciones puede volverse contrario, lo que significa que todas las estrategias deben ser revisadas. Debido a la importancia práctica de este problema, se han sugerido una variedad de métodos, que van desde la incorporación de cambios de régimen en la dinámica de Markov hasta numerosos conceptos que abordan la incertidumbre del modelo. En este trabajo, sugerimos un enfoque pragmático y práctico utilizando una reformulación natural de este problema como un sistema de cambio convexo, lo que permite aplicar algoritmos numéricos eficientes.