logo móvil
Contáctanos

La optimización convexa de procesos de decisión de Markov basada en la transformada Z: un marco teórico para la descomposición en dos espacios y la reconstrucción de programación lineal

Autores: Qiu, Shiqing; Wang, Haoyu; Zhang, Yuxin; Ke, Zong; Li, Zichao

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

La optimización convexa de procesos de decisión de Markov basada en la transformada Z: un marco teórico para la descomposición en dos espacios y la reconstrucción de programación lineal


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Estudio
Marco matemático
Optimización estocástica del mantenimiento
Sistemas de producción
Procesos de decisión de Markov
Teoría de programación convexa

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones


Descripción
Este estudio establece un nuevo marco matemático para la optimización estocástica del mantenimiento en sistemas de producción al integrar procesos de decisión de Markov (MDPs) con la teoría de programación convexa. Desarrollamos un método de descomposición en espacio dual basado en la transformación Z para reconstruir MDPs en una forma de programación lineal resoluble, resolviendo la inestabilidad inherente de los modelos tradicionales causada por condiciones iniciales inciertas y transiciones de estado no estacionarias. El enfoque propuesto introduce tres innovaciones matemáticas: (i) un mecanismo de agrupación espectral que reduce la dimensionalidad del espacio de estados mientras preserva las propiedades de Markov, (ii) una formulación dual de Lagrange con funciones de penalización adaptativas para manejar restricciones operativas, y (iii) un algoritmo de inicio rápido que acelera la convergencia en optimización convexa de alta dimensionalidad. El análisis teórico demuestra que la política derivada logra estabilidad en transiciones probabilísticas a través de argumentos de convergencia de martingalas, demostrando invarianza estructural a las distribuciones iniciales. Validaciones experimentales en procesos de producción revelan que nuestro modelo reduce los costos de mantenimiento a largo plazo en un 36.17% en comparación con simulaciones de Monte Carlo (costo promedio de 1500 vs. 2350) y mejora la eficiencia computacional en un 14.29% en comparación con los métodos de Q-learning. Los análisis de sensibilidad confirman la robustez en regímenes de falla distribuidos de Weibull (parámetro de forma [1.2, 4.8]) y restricciones de recursos variables.

Otros recursos que podrían interesarte

Temas Virtualpro