logo móvil
Contáctanos

Optimizando la negociación automatizada: integrando el modelado del oponente con el aprendizaje por refuerzo para mejorar la estrategia

Autores: Zhang, Ya; Wu, Jinghua; Cao, Ruiyang

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Optimizando la negociación automatizada: integrando el modelado del oponente con el aprendizaje por refuerzo para mejorar la estrategia


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Basado en agentes
Negociación automatizada
Análisis del oponente
Aprendizaje por refuerzo
Formulación de estrategias
Fortaleza de la relación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 32

Citaciones: Sin citaciones


Descripción
La negociación automatizada basada en agentes tiene como objetivo mejorar los procesos de toma de decisiones al predefinir reglas, estrategias y objetivos de negociación para lograr acuerdos mutuamente aceptables. Sin embargo, la mayoría de las investigaciones existentes se centran principalmente en modelar la fase formal de negociación, mientras descuidan el papel crítico del análisis del oponente durante la etapa de pre-negociación. Además, a menudo se pasa por alto el impacto de la selección y clasificación del oponente en la formulación de estrategias. Para abordar estas brechas, proponemos un nuevo marco de negociación automatizada que permite al agente utilizar el aprendizaje por refuerzo, mejorado por el modelado del oponente, para la optimización de estrategias durante la etapa de negociación. En primer lugar, analizamos las características de topología de nodo y red dentro de una red relacional basada en agentes para descubrir la fuerza potencial y los tipos de relaciones entre las partes negociadoras. Luego, estos resultados de análisis se utilizan para informar ajustes de estrategia a través del aprendizaje por refuerzo, donde diferentes estrategias de negociación se seleccionan en función del perfil del oponente. Específicamente, las expectativas de los agentes se ajustan según la fuerza de la relación, asegurando que las expectativas de las partes negociadoras se representen con precisión en diferentes niveles de fuerza de relación. Mientras tanto, los resultados de clasificación de la relación se utilizan para ajustar el factor de descuento dentro de un algoritmo de negociación Q-learning. Finalmente, realizamos una serie de experimentos, y el análisis comparativo demuestra que nuestro modelo propuesto supera a los marcos de negociación existentes en términos de eficiencia, utilidad y equidad en la negociación.

Otros recursos que podrían interesarte

Temas Virtualpro