logo móvil
Contáctanos

Control Supervisory Modular No Bloqueante de Sistemas de Eventos Discretos a través del Aprendizaje por Refuerzo y Agrupamiento K-Means

Autores: Yang, Junjun; Tan, Kaige; Feng, Lei

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Control Supervisory Modular No Bloqueante de Sistemas de Eventos Discretos a través del Aprendizaje por Refuerzo y Agrupamiento K-Means


Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Aprendizaje por refuerzo
Agrupamiento k-means
Control no bloqueante
Explosión de estados
Estados alcanzables
Control supervisado

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 18

Citaciones: Sin citaciones


Descripción
Los métodos tradicionales de control supervisado para el control no bloqueante de sistemas de eventos discretos a menudo sufren de una complejidad computacional exponencial. Los enfoques basados en el aprendizaje por refuerzo mitigan la explosión de estados al muestrear muchas secuencias aleatorias en lugar de calcular el producto sincrónico de múltiples supervisores modulares, pero tienen dificultades con espacios de estado alcanzables limitados. Una novedad principal de este estudio es utilizar el método de agrupamiento K-means para la inferencia en línea con los valores de estado-acción aprendidos. El método de agrupamiento divide todos los eventos en un estado en el grupo bueno y el grupo malo. Los eventos en el grupo bueno son permitidos por el supervisor. La política del supervisor obtenida puede garantizar tanto las restricciones del sistema como una mayor libertad de control en comparación con los supervisores convencionales basados en RL. El marco propuesto se valida mediante dos estudios de caso: un sistema de línea de transferencia industrial (TL) y un sistema de vehículo guiado automatizado (AGV). En el estudio de caso de TL, los estados alcanzables no bloqueantes aumentan de 56 a 72, mientras que en el estudio de caso de AGV, se observa una expansión sustancial de 481 a 3558 estados. Nuestro nuevo método logra un equilibrio entre la eficiencia computacional y el control supervisado no bloqueante.

Otros recursos que podrían interesarte

Temas Virtualpro