logo móvil
Contáctanos

Programación de Formación Multi-Etapa Basada en Aprendizaje con un Controlador Híbrido

Autores: Zhang, Zhichao; Li, Yao

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Programación de Formación Multi-Etapa Basada en Aprendizaje con un Controlador Híbrido


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Sistemas multiagente
Formación
Programación de transmisión
Recursos limitados
Energía de comunicación
Aprendizaje por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
En las últimas décadas, los sistemas multiagente han sido un tema candente debido a sus amplias aplicaciones, y la formación de sistemas multiagente es una rama que involucra navegación, evitación de obstáculos, diseño de controladores y otros problemas. Debido a los crecientes requisitos de precisión y eficiencia, así como a la necesidad de un puente que vincule las etapas de detección y control, la importancia de la programación de transmisión está emergiendo gradualmente, con la programación de recursos limitados bajo diversas restricciones para completar mejor las tareas convirtiéndose en un foco de atención. Sin embargo, la mayoría de la literatura solo considera el proceso de formación como un todo, mientras que pasa por alto las discrepancias en el proceso de formación en diferentes etapas temporales. En este artículo, se estudia un problema de programación de formación en múltiples etapas con recursos de comunicación limitados. Se ha propuesto un modelo de múltiples etapas basado en los diferentes niveles de finalización de la formación. En comparación con el modelo de una sola etapa, el modelo de múltiples etapas propuesto refleja los diferentes requisitos durante el proceso de formación. Además, para ahorrar energía de comunicación, se han definido tres modos de transmisión para reducir el consumo de energía en términos de frecuencia de comunicación y radio de comunicación. Considerando la necesidad de la programación dinámica de parámetros acoplados, proponemos un controlador híbrido basado en aprendizaje por refuerzo que incluye un controlador básico y un controlador difuso. El controlador híbrido, que ajusta continuamente los parámetros de acuerdo con los requisitos de cada etapa, realiza un equilibrio entre el rendimiento del sistema y el consumo de energía. Además, el aprendizaje por refuerzo asegura que todos los parámetros sean óptimos en la situación correspondiente. Los resultados de la simulación muestran que nuestro controlador asegura tanto un rendimiento dinámico como en estado estable con un menor consumo de energía. La comparación con otras estrategias de programación demuestra la optimalidad y efectividad de nuestro marco y algoritmos propuestos.

Otros recursos que podrían interesarte

Temas Virtualpro