Control Supervisory Modular No Bloqueante de Sistemas de Eventos Discretos a través del Aprendizaje por Refuerzo y Agrupamiento K-Means

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Control Supervisory Modular No Bloqueante de Sistemas de Eventos Discretos a través del Aprendizaje por Refuerzo y Agrupamiento K-Means

Autores: Yang, Junjun; Tan, Kaige; Feng, Lei

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Control Supervisory Modular No Bloqueante de Sistemas de Eventos Discretos a través del Aprendizaje por Refuerzo y Agrupamiento K-Means

Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Aprendizaje por refuerzo

Agrupamiento k-means

Control no bloqueante

Explosión de estados

Estados alcanzables

Control supervisado

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 18

Citaciones: Sin citaciones

Los métodos tradicionales de control supervisado para el control no bloqueante de sistemas de eventos discretos a menudo sufren de una complejidad computacional exponencial. Los enfoques basados en el aprendizaje por refuerzo mitigan la explosión de estados al muestrear muchas secuencias aleatorias en lugar de calcular el producto sincrónico de múltiples supervisores modulares, pero tienen dificultades con espacios de estado alcanzables limitados. Una novedad principal de este estudio es utilizar el método de agrupamiento K-means para la inferencia en línea con los valores de estado-acción aprendidos. El método de agrupamiento divide todos los eventos en un estado en el grupo bueno y el grupo malo. Los eventos en el grupo bueno son permitidos por el supervisor. La política del supervisor obtenida puede garantizar tanto las restricciones del sistema como una mayor libertad de control en comparación con los supervisores convencionales basados en RL. El marco propuesto se valida mediante dos estudios de caso: un sistema de línea de transferencia industrial (TL) y un sistema de vehículo guiado automatizado (AGV). En el estudio de caso de TL, los estados alcanzables no bloqueantes aumentan de 56 a 72, mientras que en el estudio de caso de AGV, se observa una expansión sustancial de 481 a 3558 estados. Nuestro nuevo método logra un equilibrio entre la eficiencia computacional y el control supervisado no bloqueante.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro