La optimización convexa de procesos de decisión de Markov basada en la transformada Z: un marco teórico para la descomposición en dos espacios y la reconstrucción de programación lineal
Autores: Qiu, Shiqing; Wang, Haoyu; Zhang, Yuxin; Ke, Zong; Li, Zichao
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
La optimización convexa de procesos de decisión de Markov basada en la transformada Z: un marco teórico para la descomposición en dos espacios y la reconstrucción de programación lineal
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudio
Marco matemático
Optimización estocástica del mantenimiento
Sistemas de producción
Procesos de decisión de Markov
Teoría de programación convexa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Este estudio establece un nuevo marco matemático para la optimización estocástica del mantenimiento en sistemas de producción al integrar procesos de decisión de Markov (MDPs) con la teoría de programación convexa. Desarrollamos un método de descomposición en espacio dual basado en la transformación Z para reconstruir MDPs en una forma de programación lineal resoluble, resolviendo la inestabilidad inherente de los modelos tradicionales causada por condiciones iniciales inciertas y transiciones de estado no estacionarias. El enfoque propuesto introduce tres innovaciones matemáticas: (i) un mecanismo de agrupación espectral que reduce la dimensionalidad del espacio de estados mientras preserva las propiedades de Markov, (ii) una formulación dual de Lagrange con funciones de penalización adaptativas para manejar restricciones operativas, y (iii) un algoritmo de inicio rápido que acelera la convergencia en optimización convexa de alta dimensionalidad. El análisis teórico demuestra que la política derivada logra estabilidad en transiciones probabilísticas a través de argumentos de convergencia de martingalas, demostrando invarianza estructural a las distribuciones iniciales. Validaciones experimentales en procesos de producción revelan que nuestro modelo reduce los costos de mantenimiento a largo plazo en un 36.17% en comparación con simulaciones de Monte Carlo (costo promedio de 1500 vs. 2350) y mejora la eficiencia computacional en un 14.29% en comparación con los métodos de Q-learning. Los análisis de sensibilidad confirman la robustez en regímenes de falla distribuidos de Weibull (parámetro de forma [1.2, 4.8]) y restricciones de recursos variables.
Descripción
Este estudio establece un nuevo marco matemático para la optimización estocástica del mantenimiento en sistemas de producción al integrar procesos de decisión de Markov (MDPs) con la teoría de programación convexa. Desarrollamos un método de descomposición en espacio dual basado en la transformación Z para reconstruir MDPs en una forma de programación lineal resoluble, resolviendo la inestabilidad inherente de los modelos tradicionales causada por condiciones iniciales inciertas y transiciones de estado no estacionarias. El enfoque propuesto introduce tres innovaciones matemáticas: (i) un mecanismo de agrupación espectral que reduce la dimensionalidad del espacio de estados mientras preserva las propiedades de Markov, (ii) una formulación dual de Lagrange con funciones de penalización adaptativas para manejar restricciones operativas, y (iii) un algoritmo de inicio rápido que acelera la convergencia en optimización convexa de alta dimensionalidad. El análisis teórico demuestra que la política derivada logra estabilidad en transiciones probabilísticas a través de argumentos de convergencia de martingalas, demostrando invarianza estructural a las distribuciones iniciales. Validaciones experimentales en procesos de producción revelan que nuestro modelo reduce los costos de mantenimiento a largo plazo en un 36.17% en comparación con simulaciones de Monte Carlo (costo promedio de 1500 vs. 2350) y mejora la eficiencia computacional en un 14.29% en comparación con los métodos de Q-learning. Los análisis de sensibilidad confirman la robustez en regímenes de falla distribuidos de Weibull (parámetro de forma [1.2, 4.8]) y restricciones de recursos variables.