Nfsp-plt: resolviendo juegos con un método basado en nfsp-per ponderado

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Nfsp-plt: resolviendo juegos con un método basado en nfsp-per ponderado

Autores: Li, Huale; Qi, Shuhan; Zhang, Jiajia; Zhang, Dandan; Yao, Lin; Wang, Xuan; Li, Qi; Xiao, Jing

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Nfsp-plt: resolviendo juegos con un método basado en nfsp-per ponderado

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Estrategia de equilibrio

Autojuego ficticio neuronal

Equilibrio de Nash

Datos de muestra

Eficiencia de entrenamiento

Estrategia de respuesta óptima

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones

La estrategia de equilibrio de Nash es un objetivo típico al resolver juegos de información imperfecta de dos jugadores (IIGs). El autojuego ficticio neuronal (NFSP) es un método popular para encontrar el equilibrio de Nash en IIGs, que es el primer método de extremo a extremo utilizado para calcular la estrategia de equilibrio de Nash. Sin embargo, el entrenamiento de NFSP requiere una gran cantidad de datos de muestra y el costo interactivo de obtener dichos datos suele ser muy alto. Darse cuenta del entrenamiento eficiente de la red bajo muestras limitadas es un problema urgente. En este documento, primero propusimos un nuevo método basado en NFSP, NFSP con repetición de experiencia priorizada (NFSP-PER), para mejorar la eficiencia del entrenamiento de muestras. Luego, se propuso un NFSP-PER ponderado con tiempo de aprendizaje (NFSP-PLT) para controlar el grado de utilización de muestras ponderadas por prioridad. Además, basado en el NFSP-PLT, se utiliza un límite superior de confianza adaptativo aplicado al árbol (UCT) para resolver la estrategia de respuesta óptima, lo que hace que la estrategia de resolución sea más precisa. Los extensos resultados experimentales muestran que el NFSP-PLT propuesto mejora eficazmente la eficiencia de aprendizaje de muestras en comparación con los trabajos existentes.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro