Optimizando la negociación automatizada: integrando el modelado del oponente con el aprendizaje por refuerzo para mejorar la estrategia
Autores: Zhang, Ya; Wu, Jinghua; Cao, Ruiyang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Optimizando la negociación automatizada: integrando el modelado del oponente con el aprendizaje por refuerzo para mejorar la estrategia
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Basado en agentes
Negociación automatizada
Análisis del oponente
Aprendizaje por refuerzo
Formulación de estrategias
Fortaleza de la relación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La negociación automatizada basada en agentes tiene como objetivo mejorar los procesos de toma de decisiones al predefinir reglas, estrategias y objetivos de negociación para lograr acuerdos mutuamente aceptables. Sin embargo, la mayoría de las investigaciones existentes se centran principalmente en modelar la fase formal de negociación, mientras descuidan el papel crítico del análisis del oponente durante la etapa de pre-negociación. Además, a menudo se pasa por alto el impacto de la selección y clasificación del oponente en la formulación de estrategias. Para abordar estas brechas, proponemos un nuevo marco de negociación automatizada que permite al agente utilizar el aprendizaje por refuerzo, mejorado por el modelado del oponente, para la optimización de estrategias durante la etapa de negociación. En primer lugar, analizamos las características de topología de nodo y red dentro de una red relacional basada en agentes para descubrir la fuerza potencial y los tipos de relaciones entre las partes negociadoras. Luego, estos resultados de análisis se utilizan para informar ajustes de estrategia a través del aprendizaje por refuerzo, donde diferentes estrategias de negociación se seleccionan en función del perfil del oponente. Específicamente, las expectativas de los agentes se ajustan según la fuerza de la relación, asegurando que las expectativas de las partes negociadoras se representen con precisión en diferentes niveles de fuerza de relación. Mientras tanto, los resultados de clasificación de la relación se utilizan para ajustar el factor de descuento dentro de un algoritmo de negociación Q-learning. Finalmente, realizamos una serie de experimentos, y el análisis comparativo demuestra que nuestro modelo propuesto supera a los marcos de negociación existentes en términos de eficiencia, utilidad y equidad en la negociación.
Descripción
La negociación automatizada basada en agentes tiene como objetivo mejorar los procesos de toma de decisiones al predefinir reglas, estrategias y objetivos de negociación para lograr acuerdos mutuamente aceptables. Sin embargo, la mayoría de las investigaciones existentes se centran principalmente en modelar la fase formal de negociación, mientras descuidan el papel crítico del análisis del oponente durante la etapa de pre-negociación. Además, a menudo se pasa por alto el impacto de la selección y clasificación del oponente en la formulación de estrategias. Para abordar estas brechas, proponemos un nuevo marco de negociación automatizada que permite al agente utilizar el aprendizaje por refuerzo, mejorado por el modelado del oponente, para la optimización de estrategias durante la etapa de negociación. En primer lugar, analizamos las características de topología de nodo y red dentro de una red relacional basada en agentes para descubrir la fuerza potencial y los tipos de relaciones entre las partes negociadoras. Luego, estos resultados de análisis se utilizan para informar ajustes de estrategia a través del aprendizaje por refuerzo, donde diferentes estrategias de negociación se seleccionan en función del perfil del oponente. Específicamente, las expectativas de los agentes se ajustan según la fuerza de la relación, asegurando que las expectativas de las partes negociadoras se representen con precisión en diferentes niveles de fuerza de relación. Mientras tanto, los resultados de clasificación de la relación se utilizan para ajustar el factor de descuento dentro de un algoritmo de negociación Q-learning. Finalmente, realizamos una serie de experimentos, y el análisis comparativo demuestra que nuestro modelo propuesto supera a los marcos de negociación existentes en términos de eficiencia, utilidad y equidad en la negociación.