DEDMAC: Desenredando Mensajes de Entorno y Decisión para la Comunicación Multi-Agente
Autores: Liang, Yihan; Li, Jinlong
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
DEDMAC: Desenredando Mensajes de Entorno y Decisión para la Comunicación Multi-Agente
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Comunicación
Desafíos
Características ambientales
Intenciones de decisión
Desenredado
Sistemas multiagente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En el aprendizaje por refuerzo multiagente cooperativo (MARL), la comunicación puede abordar los desafíos de la observabilidad parcial y la no estacionariedad ambiental al transmitir características del entorno e intenciones de decisión, respectivamente. Sin embargo, los métodos existentes se centran en un solo tipo de información, sin abordar ambos desafíos simultáneamente, o confunden estas señales, lo que provoca que los agentes confundan el contexto ambiental con las intenciones de decisión. Este artículo presenta Desentrelazando Mensajes de Entorno y Decisión para la Comunicación Multiagente (DEDMAC), un marco que separa explícitamente estos dos tipos de información en dos flujos de mensajes distintos y los procesa de manera independiente. Específicamente, los mensajes de entorno se integran en la memoria a largo plazo para resolver la observabilidad parcial, mientras que los mensajes de decisión proporcionan señales de intención instantáneas para mitigar la no estacionariedad y facilitar la coordinación. Para prevenir la confusión semántica entre los dos flujos de mensajes, empleamos restricciones de información mutua para asegurar el desentrelazado semántico. Además, diseñamos un mecanismo que aprovecha la información global para corregir sesgos de intención en los mensajes de decisión que resultan de perspectivas locales limitadas durante la generación. Las evaluaciones en complejos benchmarks multiagente demuestran que DEDMAC supera significativamente a los métodos basados en comunicación de última generación. Estos hallazgos indican que la separación explícita y el procesamiento especializado de las semánticas de entorno y decisión son críticos para lograr un rendimiento óptimo en sistemas multiagente dinámicos y colaborativos.
Descripción
En el aprendizaje por refuerzo multiagente cooperativo (MARL), la comunicación puede abordar los desafíos de la observabilidad parcial y la no estacionariedad ambiental al transmitir características del entorno e intenciones de decisión, respectivamente. Sin embargo, los métodos existentes se centran en un solo tipo de información, sin abordar ambos desafíos simultáneamente, o confunden estas señales, lo que provoca que los agentes confundan el contexto ambiental con las intenciones de decisión. Este artículo presenta Desentrelazando Mensajes de Entorno y Decisión para la Comunicación Multiagente (DEDMAC), un marco que separa explícitamente estos dos tipos de información en dos flujos de mensajes distintos y los procesa de manera independiente. Específicamente, los mensajes de entorno se integran en la memoria a largo plazo para resolver la observabilidad parcial, mientras que los mensajes de decisión proporcionan señales de intención instantáneas para mitigar la no estacionariedad y facilitar la coordinación. Para prevenir la confusión semántica entre los dos flujos de mensajes, empleamos restricciones de información mutua para asegurar el desentrelazado semántico. Además, diseñamos un mecanismo que aprovecha la información global para corregir sesgos de intención en los mensajes de decisión que resultan de perspectivas locales limitadas durante la generación. Las evaluaciones en complejos benchmarks multiagente demuestran que DEDMAC supera significativamente a los métodos basados en comunicación de última generación. Estos hallazgos indican que la separación explícita y el procesamiento especializado de las semánticas de entorno y decisión son críticos para lograr un rendimiento óptimo en sistemas multiagente dinámicos y colaborativos.