Un modelo de difusión markoviana restringida para controlar la acumulación de contaminación
Autores: Escobedo-Trujillo, Beatris Adriana; López-Barrientos, José Daniel; Garrido-Meléndez, Javier
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un modelo de difusión markoviana restringida para controlar la acumulación de contaminación
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Problema de control estocástico
Técnicas de programación dinámica
Enfoque de multiplicadores de Lagrange
Coeficientes no acotados
Tipo de lazo cerrado no estacionario
Modelo de acumulación de contaminantes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Este trabajo presenta un estudio de un problema de control estocástico de horizonte temporal finito con restricciones tanto en las funciones de recompensa como en las de coste. Para ello, utiliza técnicas estándar de programación dinámica y una extensión del enfoque clásico de multiplicadores de Lagrange. Los coeficientes considerados aquí se suponen no acotados, y las estrategias obtenidas son de tipo cerrado de bucle no estacionario. El hilo conductor del documento es una secuencia de ejemplos sobre un modelo de acumulación de contaminación, que se utiliza con el propósito de mostrar tres algoritmos para replicar los resultados. Allí, el lector puede encontrar un resultado sobre la intercambiabilidad de límites en un problema de Dirichlet.
Descripción
Este trabajo presenta un estudio de un problema de control estocástico de horizonte temporal finito con restricciones tanto en las funciones de recompensa como en las de coste. Para ello, utiliza técnicas estándar de programación dinámica y una extensión del enfoque clásico de multiplicadores de Lagrange. Los coeficientes considerados aquí se suponen no acotados, y las estrategias obtenidas son de tipo cerrado de bucle no estacionario. El hilo conductor del documento es una secuencia de ejemplos sobre un modelo de acumulación de contaminación, que se utiliza con el propósito de mostrar tres algoritmos para replicar los resultados. Allí, el lector puede encontrar un resultado sobre la intercambiabilidad de límites en un problema de Dirichlet.