Estimación robusta de estadísticas de problemas de control óptimo restringido de acumulación de contaminación (Parte I)
Autores: Escobedo-Trujillo, Beatris Adriana; López-Barrientos, José Daniel; Higuera-Chan, Carmen Geraldi; Alaffita-Hernández, Francisco Alejandro
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estimación robusta de estadísticas de problemas de control óptimo restringido de acumulación de contaminación (Parte I)
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudio
Control óptimo
Acumulación de contaminación
Sistema dinámico
Proceso de difusión
Control óptimo restringido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
En este trabajo, estudiamos un control óptimo restringido sobre la acumulación de contaminación donde el sistema dinámico estaba gobernado por un proceso de difusión que depende de parámetros desconocidos, los cuales necesitan ser estimados. Dado que los valores reales son desconocidos, pretendíamos determinar políticas (adaptativas) que maximicen un criterio de recompensa descontada con restricciones, es decir, utilizamos multiplicadores de Lagrange para encontrar políticas óptimas (adaptativas) para la versión no restringida del problema de control óptimo. En el contexto actual, el sistema dinámico evoluciona como un proceso de difusión y la función de coste debe ser minimizada por otra función (típicamente una constante), que desempeña el papel de restricción en el modelo de control. Ofrecemos soluciones a este problema utilizando herramientas estándar de programación dinámica bajo el criterio de pago descontado restringido en un horizonte infinito y el llamado principio de estimación y control. Utilizamos estimadores de máxima verosimilitud mediante una aproximación de error cuadrático mínimo en un modelo de acumulación de contaminación para ilustrar nuestros resultados. Una de las ventajas de nuestro enfoque en comparación con otros es la intuición detrás de él: encontrar políticas óptimas para una versión estimada del problema y permitir que esta estimación tienda hacia la versión real del problema. Sin embargo, la mayoría de los analistas de riesgo no estarán tan familiarizados con nuestros métodos como lo están, por ejemplo, con el control predictivo del modelo, la caja de herramientas de control robusto de MATLAB o el método de expansión del caos polinómico, que se han utilizado en la literatura para abordar problemas similares.
Descripción
En este trabajo, estudiamos un control óptimo restringido sobre la acumulación de contaminación donde el sistema dinámico estaba gobernado por un proceso de difusión que depende de parámetros desconocidos, los cuales necesitan ser estimados. Dado que los valores reales son desconocidos, pretendíamos determinar políticas (adaptativas) que maximicen un criterio de recompensa descontada con restricciones, es decir, utilizamos multiplicadores de Lagrange para encontrar políticas óptimas (adaptativas) para la versión no restringida del problema de control óptimo. En el contexto actual, el sistema dinámico evoluciona como un proceso de difusión y la función de coste debe ser minimizada por otra función (típicamente una constante), que desempeña el papel de restricción en el modelo de control. Ofrecemos soluciones a este problema utilizando herramientas estándar de programación dinámica bajo el criterio de pago descontado restringido en un horizonte infinito y el llamado principio de estimación y control. Utilizamos estimadores de máxima verosimilitud mediante una aproximación de error cuadrático mínimo en un modelo de acumulación de contaminación para ilustrar nuestros resultados. Una de las ventajas de nuestro enfoque en comparación con otros es la intuición detrás de él: encontrar políticas óptimas para una versión estimada del problema y permitir que esta estimación tienda hacia la versión real del problema. Sin embargo, la mayoría de los analistas de riesgo no estarán tan familiarizados con nuestros métodos como lo están, por ejemplo, con el control predictivo del modelo, la caja de herramientas de control robusto de MATLAB o el método de expansión del caos polinómico, que se han utilizado en la literatura para abordar problemas similares.