Política de diferencia de cognición jerárquica multiagente para la cooperación multiagente
Autores: Wang, Huimu; Liu, Zhen; Yi, Jianqiang; Pu, Zhiqiang
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Política de diferencia de cognición jerárquica multiagente para la cooperación multiagente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Cooperación multiagente
Campos de investigación
Comportamiento de cooperación
Política de diferencia de cognición jerárquica
Red de grupo jerárquico
Red de diferencia de cognición
Red de comunicación suave
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
La cooperación multiagente es uno de los campos de investigación más atractivos en sistemas multiagente. Hay muchos intentos realizados por investigadores en este campo para promover el comportamiento cooperativo. Sin embargo, aún existen varios problemas, como interacciones complejas entre diferentes grupos de agentes, contenidos de comunicación redundantes de agentes irrelevantes, que impiden el aprendizaje y la convergencia de los comportamientos de cooperación de los agentes. Para abordar las limitaciones anteriores, en este documento se propone un método novedoso llamado política de diferencia de cognición jerárquica multiagente (MA-HCDP). Incluye una red de grupo jerárquico (HGN), una red de diferencia de cognición (CDN) y una red de comunicación suave (SCN). HGN está diseñada para distinguir la información subyacente de las diversas observaciones de los grupos (incluido el grupo amistoso, el grupo enemigo y el grupo de objetos) y extraer representaciones de estado de alta dimensión de diferentes grupos. CDN está diseñada en base a un auto-codificador variacional para permitir que cada agente elija adaptativamente a sus vecinos (objetivos de comunicación) con su diferencia de cognición ambiental. SCN está diseñada para manejar las interacciones complejas entre los agentes con un mecanismo de atención suave. Los resultados de las simulaciones demuestran la efectividad superior de nuestro método en comparación con los métodos existentes.
Descripción
La cooperación multiagente es uno de los campos de investigación más atractivos en sistemas multiagente. Hay muchos intentos realizados por investigadores en este campo para promover el comportamiento cooperativo. Sin embargo, aún existen varios problemas, como interacciones complejas entre diferentes grupos de agentes, contenidos de comunicación redundantes de agentes irrelevantes, que impiden el aprendizaje y la convergencia de los comportamientos de cooperación de los agentes. Para abordar las limitaciones anteriores, en este documento se propone un método novedoso llamado política de diferencia de cognición jerárquica multiagente (MA-HCDP). Incluye una red de grupo jerárquico (HGN), una red de diferencia de cognición (CDN) y una red de comunicación suave (SCN). HGN está diseñada para distinguir la información subyacente de las diversas observaciones de los grupos (incluido el grupo amistoso, el grupo enemigo y el grupo de objetos) y extraer representaciones de estado de alta dimensión de diferentes grupos. CDN está diseñada en base a un auto-codificador variacional para permitir que cada agente elija adaptativamente a sus vecinos (objetivos de comunicación) con su diferencia de cognición ambiental. SCN está diseñada para manejar las interacciones complejas entre los agentes con un mecanismo de atención suave. Los resultados de las simulaciones demuestran la efectividad superior de nuestro método en comparación con los métodos existentes.