Investigación e implementación de decisiones inteligentes basadas en conocimiento a priori y algoritmos DQN en entorno de juego de guerra
Autores: Sun, Yuxiang; Yuan, Bo; Zhang, Tao; Tang, Bojian; Zheng, Wanwen; Zhou, Xianzhong
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Investigación e implementación de decisiones inteligentes basadas en conocimiento a priori y algoritmos DQN en entorno de juego de guerra
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje por refuerzo
Control de acciones complejas
Juego de guerra multijugador
Modelos de aprendizaje por refuerzo profundo
Algoritmo de Q-learning
Algoritmo PK-DQN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
El problema de aprendizaje por refuerzo del control de acciones complejas en un juego de guerra multijugador ha sido un tema de investigación candente en los últimos años. En este documento, se diseña e implementa un sistema de juego basado en enfrentamientos por turnos con modelos de aprendizaje por refuerzo profundo de última generación. Específicamente, primero diseñamos un algoritmo de Q-learning para lograr la toma de decisiones inteligentes, que se basa en la DQN (Red Q Profunda) para modelar comportamientos de juego complejos. Luego, se introduce un algoritmo basado en conocimiento a priori PK-DQN (Conocimiento Previo-Red Q Profunda) para mejorar el algoritmo DQN, lo que acelera la velocidad de convergencia y la estabilidad del algoritmo. Los experimentos demuestran la corrección del algoritmo PK-DQN, se valida y su rendimiento supera al algoritmo DQN convencional. Además, el algoritmo PK-DQN muestra efectividad en derrotar al alto nivel de oponentes basados en reglas, lo que proporciona resultados prometedores para la exploración del campo del ajedrez inteligente y la deducción de juegos inteligentes.
Descripción
El problema de aprendizaje por refuerzo del control de acciones complejas en un juego de guerra multijugador ha sido un tema de investigación candente en los últimos años. En este documento, se diseña e implementa un sistema de juego basado en enfrentamientos por turnos con modelos de aprendizaje por refuerzo profundo de última generación. Específicamente, primero diseñamos un algoritmo de Q-learning para lograr la toma de decisiones inteligentes, que se basa en la DQN (Red Q Profunda) para modelar comportamientos de juego complejos. Luego, se introduce un algoritmo basado en conocimiento a priori PK-DQN (Conocimiento Previo-Red Q Profunda) para mejorar el algoritmo DQN, lo que acelera la velocidad de convergencia y la estabilidad del algoritmo. Los experimentos demuestran la corrección del algoritmo PK-DQN, se valida y su rendimiento supera al algoritmo DQN convencional. Además, el algoritmo PK-DQN muestra efectividad en derrotar al alto nivel de oponentes basados en reglas, lo que proporciona resultados prometedores para la exploración del campo del ajedrez inteligente y la deducción de juegos inteligentes.