Multi-agente multi-objetivo persecución con asignación dinámica de objetivos y optimización de red de actores

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Multi-agente multi-objetivo persecución con asignación dinámica de objetivos y optimización de red de actores

Autores: Han, Baoqiang; Shi, Lin; Wang, Xueyuan; Zhuang, Lihua

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Multi-agente multi-objetivo persecución con asignación dinámica de objetivos y optimización de red de actores

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Cooperativo

Toma de decisiones

Sistemas multiagente

Aprendizaje profundo por refuerzo

Estrategias de asignación

Políticas de seguimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones

En este documento, consideramos el problema de toma de decisiones cooperativa para el seguimiento de múltiples objetivos en sistemas de múltiples agentes utilizando algoritmos de aprendizaje profundo de refuerzo multiagente. La persecución multiagente de múltiples objetivos ha enfrentado nuevos desafíos en aplicaciones prácticas, donde los perseguidores necesitan planificar trayectorias libres de colisiones y estrategias de asignación de múltiples objetivos adecuadas para determinar qué objetivo seguir en el momento actual para cada perseguidor. Diseñamos tres estrategias de asignación de múltiples objetivos factibles desde diferentes perspectivas. Comparamos nuestras estrategias de asignación en el entorno de persecución multiagente de múltiples objetivos que modela el riesgo de colisión y verificamos la superioridad de la estrategia de asignación marcada como POLICY3, considerando la perspectiva general de agentes y objetivos. También encontramos que hay una brecha significativa en las políticas de seguimiento aprendidas por los agentes al utilizar el algoritmo de aprendizaje por refuerzo multiagente MATD3. Proponemos un algoritmo mejorado, DAO-MATD3, basado en la optimización de la red de actores dinámicos. Los resultados de la simulación muestran que el método propuesto POLICY3-DAO-MATD3 mejora efectivamente la eficiencia para completar tareas de persecución multiagente de múltiples objetivos.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro