Estimación de estadísticas robustas en problemas de control óptimo restringido de acumulación de contaminación (Parte II: Cambios de Markov)
Autores: Escobedo-Trujillo, Beatris Adriana; López-Barrientos, José Daniel; Higuera-Chan, Carmen Geraldi; Alaffita-Hernández, Francisco Alejandro
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estimación de estadísticas robustas en problemas de control óptimo restringido de acumulación de contaminación (Parte II: Cambios de Markov)
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Investigación
Control óptimo
Acumulación de contaminación
Sistema dinámico
Proceso de difusión
Parámetro desconocido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Este artículo es un seguimiento de la investigación iniciada por los autores sobre el problema de control óptimo restringido aplicado a la acumulación de contaminación. Consideramos un sistema dinámico gobernado por un proceso de difusión con múltiples modos que depende de un parámetro desconocido. Estudiaremos los componentes del modelo y sus restricciones y propondremos un esquema para resolver el problema en el cual es posible determinar políticas (adaptativas) que maximicen un criterio de recompensa descontado adecuado utilizando técnicas estándar de programación dinámica en combinación con métodos de estimación discreta para el parámetro desconocido. Finalmente, desarrollamos un ejemplo numérico para ilustrar nuestros resultados con un caso particular del método de aproximación de mínimos cuadrados.
Descripción
Este artículo es un seguimiento de la investigación iniciada por los autores sobre el problema de control óptimo restringido aplicado a la acumulación de contaminación. Consideramos un sistema dinámico gobernado por un proceso de difusión con múltiples modos que depende de un parámetro desconocido. Estudiaremos los componentes del modelo y sus restricciones y propondremos un esquema para resolver el problema en el cual es posible determinar políticas (adaptativas) que maximicen un criterio de recompensa descontado adecuado utilizando técnicas estándar de programación dinámica en combinación con métodos de estimación discreta para el parámetro desconocido. Finalmente, desarrollamos un ejemplo numérico para ilustrar nuestros resultados con un caso particular del método de aproximación de mínimos cuadrados.