logo móvil
Contáctanos

DEDMAC: Desenredando Mensajes de Entorno y Decisión para la Comunicación Multi-Agente

Autores: Liang, Yihan; Li, Jinlong

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

DEDMAC: Desenredando Mensajes de Entorno y Decisión para la Comunicación Multi-Agente


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Comunicación
Desafíos
Características ambientales
Intenciones de decisión
Desenredado
Sistemas multiagente

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
En el aprendizaje por refuerzo multiagente cooperativo (MARL), la comunicación puede abordar los desafíos de la observabilidad parcial y la no estacionariedad ambiental al transmitir características del entorno e intenciones de decisión, respectivamente. Sin embargo, los métodos existentes se centran en un solo tipo de información, sin abordar ambos desafíos simultáneamente, o confunden estas señales, lo que provoca que los agentes confundan el contexto ambiental con las intenciones de decisión. Este artículo presenta Desentrelazando Mensajes de Entorno y Decisión para la Comunicación Multiagente (DEDMAC), un marco que separa explícitamente estos dos tipos de información en dos flujos de mensajes distintos y los procesa de manera independiente. Específicamente, los mensajes de entorno se integran en la memoria a largo plazo para resolver la observabilidad parcial, mientras que los mensajes de decisión proporcionan señales de intención instantáneas para mitigar la no estacionariedad y facilitar la coordinación. Para prevenir la confusión semántica entre los dos flujos de mensajes, empleamos restricciones de información mutua para asegurar el desentrelazado semántico. Además, diseñamos un mecanismo que aprovecha la información global para corregir sesgos de intención en los mensajes de decisión que resultan de perspectivas locales limitadas durante la generación. Las evaluaciones en complejos benchmarks multiagente demuestran que DEDMAC supera significativamente a los métodos basados en comunicación de última generación. Estos hallazgos indican que la separación explícita y el procesamiento especializado de las semánticas de entorno y decisión son críticos para lograr un rendimiento óptimo en sistemas multiagente dinámicos y colaborativos.

Otros recursos que podrían interesarte

Temas Virtualpro