Multi-agente multi-objetivo persecución con asignación dinámica de objetivos y optimización de red de actores
Autores: Han, Baoqiang; Shi, Lin; Wang, Xueyuan; Zhuang, Lihua
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Multi-agente multi-objetivo persecución con asignación dinámica de objetivos y optimización de red de actores
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Cooperativo
Toma de decisiones
Sistemas multiagente
Aprendizaje profundo por refuerzo
Estrategias de asignación
Políticas de seguimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
En este documento, consideramos el problema de toma de decisiones cooperativa para el seguimiento de múltiples objetivos en sistemas de múltiples agentes utilizando algoritmos de aprendizaje profundo de refuerzo multiagente. La persecución multiagente de múltiples objetivos ha enfrentado nuevos desafíos en aplicaciones prácticas, donde los perseguidores necesitan planificar trayectorias libres de colisiones y estrategias de asignación de múltiples objetivos adecuadas para determinar qué objetivo seguir en el momento actual para cada perseguidor. Diseñamos tres estrategias de asignación de múltiples objetivos factibles desde diferentes perspectivas. Comparamos nuestras estrategias de asignación en el entorno de persecución multiagente de múltiples objetivos que modela el riesgo de colisión y verificamos la superioridad de la estrategia de asignación marcada como POLICY3, considerando la perspectiva general de agentes y objetivos. También encontramos que hay una brecha significativa en las políticas de seguimiento aprendidas por los agentes al utilizar el algoritmo de aprendizaje por refuerzo multiagente MATD3. Proponemos un algoritmo mejorado, DAO-MATD3, basado en la optimización de la red de actores dinámicos. Los resultados de la simulación muestran que el método propuesto POLICY3-DAO-MATD3 mejora efectivamente la eficiencia para completar tareas de persecución multiagente de múltiples objetivos.
Descripción
En este documento, consideramos el problema de toma de decisiones cooperativa para el seguimiento de múltiples objetivos en sistemas de múltiples agentes utilizando algoritmos de aprendizaje profundo de refuerzo multiagente. La persecución multiagente de múltiples objetivos ha enfrentado nuevos desafíos en aplicaciones prácticas, donde los perseguidores necesitan planificar trayectorias libres de colisiones y estrategias de asignación de múltiples objetivos adecuadas para determinar qué objetivo seguir en el momento actual para cada perseguidor. Diseñamos tres estrategias de asignación de múltiples objetivos factibles desde diferentes perspectivas. Comparamos nuestras estrategias de asignación en el entorno de persecución multiagente de múltiples objetivos que modela el riesgo de colisión y verificamos la superioridad de la estrategia de asignación marcada como POLICY3, considerando la perspectiva general de agentes y objetivos. También encontramos que hay una brecha significativa en las políticas de seguimiento aprendidas por los agentes al utilizar el algoritmo de aprendizaje por refuerzo multiagente MATD3. Proponemos un algoritmo mejorado, DAO-MATD3, basado en la optimización de la red de actores dinámicos. Los resultados de la simulación muestran que el método propuesto POLICY3-DAO-MATD3 mejora efectivamente la eficiencia para completar tareas de persecución multiagente de múltiples objetivos.