Comportamiento Proactivo de Agentes en Problemas de Optimización de Restricciones Distribuidas Dinámicas

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Comportamiento Proactivo de Agentes en Problemas de Optimización de Restricciones Distribuidas Dinámicas

Autores: Agyemang, Brighter; Ren, Fenghui; Yan, Jun

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Comportamiento Proactivo de Agentes en Problemas de Optimización de Restricciones Distribuidas Dinámicas

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Problema dinámico de optimización de restricciones distribuidas

Comportamiento proactivo del agente

Modelo del entorno

Modelos autorregresivos locales

Algoritmo de paso de mensajes de compartición de experiencia temporal

Toma de decisiones.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 2

Citaciones: Sin citaciones

En los sistemas multiagente, el marco del Problema de Optimización de Restricciones Distribuidas Dinámicas (D-DCOP) es fundamental, permitiendo la descomposición de objetivos globales en restricciones de agentes. El comportamiento proactivo de los agentes es crucial en tales sistemas, permitiendo a los agentes anticipar cambios futuros y adaptarse en consecuencia. Los enfoques existentes, como los algoritmos Proactive Dynamic DCOP (PD-DCOP), a menudo requieren un modelo de entorno predefinido. Abordamos el problema de habilitar el comportamiento proactivo de los agentes en D-DCOP donde el modelo dinámico del entorno es desconocido. Específicamente, proponemos un enfoque donde los agentes aprenden modelos autorregresivos locales a partir de observaciones, prediciendo estados futuros para informar la toma de decisiones. Para lograr esto, presentamos un algoritmo de paso de mensajes de compartir experiencias temporales que aprovecha las conexiones dinámicas de los agentes y una métrica de distancia para recopilar datos de entrenamiento. Nuestro enfoque superó a los métodos de referencia en una tarea de búsqueda y extinción utilizando el Simulador de Rescate RoboCup, logrando un mejor daño total en los edificios. Los resultados experimentales se alinean con trabajos anteriores sobre la importancia de los costos de cambio de decisión y demuestran un mejor rendimiento cuando el costo de cambio se combina con un modelo aprendido.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro