logo móvil
Contáctanos

Política de diferencia de cognición jerárquica multiagente para la cooperación multiagente

Autores: Wang, Huimu; Liu, Zhen; Yi, Jianqiang; Pu, Zhiqiang

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Política de diferencia de cognición jerárquica multiagente para la cooperación multiagente


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Cooperación multiagente
Campos de investigación
Comportamiento de cooperación
Política de diferencia de cognición jerárquica
Red de grupo jerárquico
Red de diferencia de cognición
Red de comunicación suave

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 41

Citaciones: Sin citaciones


Descripción
La cooperación multiagente es uno de los campos de investigación más atractivos en sistemas multiagente. Hay muchos intentos realizados por investigadores en este campo para promover el comportamiento cooperativo. Sin embargo, aún existen varios problemas, como interacciones complejas entre diferentes grupos de agentes, contenidos de comunicación redundantes de agentes irrelevantes, que impiden el aprendizaje y la convergencia de los comportamientos de cooperación de los agentes. Para abordar las limitaciones anteriores, en este documento se propone un método novedoso llamado política de diferencia de cognición jerárquica multiagente (MA-HCDP). Incluye una red de grupo jerárquico (HGN), una red de diferencia de cognición (CDN) y una red de comunicación suave (SCN). HGN está diseñada para distinguir la información subyacente de las diversas observaciones de los grupos (incluido el grupo amistoso, el grupo enemigo y el grupo de objetos) y extraer representaciones de estado de alta dimensión de diferentes grupos. CDN está diseñada en base a un auto-codificador variacional para permitir que cada agente elija adaptativamente a sus vecinos (objetivos de comunicación) con su diferencia de cognición ambiental. SCN está diseñada para manejar las interacciones complejas entre los agentes con un mecanismo de atención suave. Los resultados de las simulaciones demuestran la efectividad superior de nuestro método en comparación con los métodos existentes.

Otros recursos que podrían interesarte

Temas Virtualpro