Plataforma de Investigación de Aprendizaje por Refuerzo para Juegos de Rol
Autores: Csereoka, Petra; Roman, Bogdan-Ionu; Micea, Mihai Victor; Popa, Clin-Adrian
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Plataforma de Investigación de Aprendizaje por Refuerzo para Juegos de Rol
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Logros
Aprendizaje por refuerzo
Métodos de aprendizaje basados en visión
Redes neuronales convolucionales
Enfoques basados en Q-learning
Redes Neuronales Q Profunda
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Los últimos logros en el campo del aprendizaje por refuerzo han alentado el desarrollo de métodos de aprendizaje basados en visión que compiten con los resultados proporcionados por humanos obtenidos en varios juegos y entornos de entrenamiento. Las redes neuronales convolucionales junto con enfoques basados en Q-learning han logrado resolver y superar a los jugadores humanos en entornos como Atari 2600, Doom o StarCraft II, pero el nicho de juegos 3D realistas con un alto grado de libertad de movimiento y gráficos ricos permanece inexplorado, a pesar de tener la mayor similitud con situaciones del mundo real. En este documento, proponemos un banco de pruebas novedoso para empujar los límites de los métodos de aprendizaje profundo, a saber, un entorno similar a OpenAI Gym basado en Dark Souls III, un juego de rol notoriamente difícil, donde incluso los jugadores humanos han tenido dificultades según se informa. Exploramos dos tipos de arquitecturas, Redes Q Profundas y Redes Q Recurrentes Profundas, proporcionando los resultados de una primera incursión en esta nueva clase de problemas. El código fuente del entorno de entrenamiento y las líneas base están disponibles.
Descripción
Los últimos logros en el campo del aprendizaje por refuerzo han alentado el desarrollo de métodos de aprendizaje basados en visión que compiten con los resultados proporcionados por humanos obtenidos en varios juegos y entornos de entrenamiento. Las redes neuronales convolucionales junto con enfoques basados en Q-learning han logrado resolver y superar a los jugadores humanos en entornos como Atari 2600, Doom o StarCraft II, pero el nicho de juegos 3D realistas con un alto grado de libertad de movimiento y gráficos ricos permanece inexplorado, a pesar de tener la mayor similitud con situaciones del mundo real. En este documento, proponemos un banco de pruebas novedoso para empujar los límites de los métodos de aprendizaje profundo, a saber, un entorno similar a OpenAI Gym basado en Dark Souls III, un juego de rol notoriamente difícil, donde incluso los jugadores humanos han tenido dificultades según se informa. Exploramos dos tipos de arquitecturas, Redes Q Profundas y Redes Q Recurrentes Profundas, proporcionando los resultados de una primera incursión en esta nueva clase de problemas. El código fuente del entorno de entrenamiento y las líneas base están disponibles.