logo móvil
Contáctanos

Multi-agente multi-objetivo persecución con asignación dinámica de objetivos y optimización de red de actores

Autores: Han, Baoqiang; Shi, Lin; Wang, Xueyuan; Zhuang, Lihua

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Multi-agente multi-objetivo persecución con asignación dinámica de objetivos y optimización de red de actores


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Cooperativo
Toma de decisiones
Sistemas multiagente
Aprendizaje profundo por refuerzo
Estrategias de asignación
Políticas de seguimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
En este documento, consideramos el problema de toma de decisiones cooperativa para el seguimiento de múltiples objetivos en sistemas de múltiples agentes utilizando algoritmos de aprendizaje profundo de refuerzo multiagente. La persecución multiagente de múltiples objetivos ha enfrentado nuevos desafíos en aplicaciones prácticas, donde los perseguidores necesitan planificar trayectorias libres de colisiones y estrategias de asignación de múltiples objetivos adecuadas para determinar qué objetivo seguir en el momento actual para cada perseguidor. Diseñamos tres estrategias de asignación de múltiples objetivos factibles desde diferentes perspectivas. Comparamos nuestras estrategias de asignación en el entorno de persecución multiagente de múltiples objetivos que modela el riesgo de colisión y verificamos la superioridad de la estrategia de asignación marcada como POLICY3, considerando la perspectiva general de agentes y objetivos. También encontramos que hay una brecha significativa en las políticas de seguimiento aprendidas por los agentes al utilizar el algoritmo de aprendizaje por refuerzo multiagente MATD3. Proponemos un algoritmo mejorado, DAO-MATD3, basado en la optimización de la red de actores dinámicos. Los resultados de la simulación muestran que el método propuesto POLICY3-DAO-MATD3 mejora efectivamente la eficiencia para completar tareas de persecución multiagente de múltiples objetivos.

Otros recursos que podrían interesarte

Temas Virtualpro