logo móvil
Contáctanos

Comportamiento Proactivo de Agentes en Problemas de Optimización de Restricciones Distribuidas Dinámicas

Autores: Agyemang, Brighter; Ren, Fenghui; Yan, Jun

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Comportamiento Proactivo de Agentes en Problemas de Optimización de Restricciones Distribuidas Dinámicas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Problema dinámico de optimización de restricciones distribuidas
Comportamiento proactivo del agente
Modelo del entorno
Modelos autorregresivos locales
Algoritmo de paso de mensajes de compartición de experiencia temporal
Toma de decisiones.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 2

Citaciones: Sin citaciones


Descripción
En los sistemas multiagente, el marco del Problema de Optimización de Restricciones Distribuidas Dinámicas (D-DCOP) es fundamental, permitiendo la descomposición de objetivos globales en restricciones de agentes. El comportamiento proactivo de los agentes es crucial en tales sistemas, permitiendo a los agentes anticipar cambios futuros y adaptarse en consecuencia. Los enfoques existentes, como los algoritmos Proactive Dynamic DCOP (PD-DCOP), a menudo requieren un modelo de entorno predefinido. Abordamos el problema de habilitar el comportamiento proactivo de los agentes en D-DCOP donde el modelo dinámico del entorno es desconocido. Específicamente, proponemos un enfoque donde los agentes aprenden modelos autorregresivos locales a partir de observaciones, prediciendo estados futuros para informar la toma de decisiones. Para lograr esto, presentamos un algoritmo de paso de mensajes de compartir experiencias temporales que aprovecha las conexiones dinámicas de los agentes y una métrica de distancia para recopilar datos de entrenamiento. Nuestro enfoque superó a los métodos de referencia en una tarea de búsqueda y extinción utilizando el Simulador de Rescate RoboCup, logrando un mejor daño total en los edificios. Los resultados experimentales se alinean con trabajos anteriores sobre la importancia de los costos de cambio de decisión y demuestran un mejor rendimiento cuando el costo de cambio se combina con un modelo aprendido.

Otros recursos que podrían interesarte

Temas Virtualpro