Enfoques que utilizan experiencia específica del dominio: ventaja basada en clonación de comportamiento del actor-crítico en juegos de baloncesto
Autores: Choi, Taehyeok; Cho, Kyungeun; Sung, Yunsick
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Enfoques que utilizan experiencia específica del dominio: ventaja basada en clonación de comportamiento del actor-crítico en juegos de baloncesto
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Investigación
Inteligencia artificial
Juegos
Aprendizaje por refuerzo
Algoritmos
Baloncesto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
La investigación sobre la aplicación de inteligencia artificial (IA) en los juegos ha ganado impulso recientemente. La mayoría de los juegos comerciales todavía utilizan IA basada en una máquina de estados finitos (FSM) debido a consideraciones de complejidad y coste. Sin embargo, la IA basada en FSM disminuye la satisfacción del usuario dado que realiza los mismos patrones de acciones consecutivas en las mismas situaciones. Esto hace necesario un nuevo enfoque de IA que aplique conocimientos específicos del dominio a algoritmos existentes de aprendizaje por refuerzo. Proponemos un enfoque A2C basado en clonación de comportamiento que mejora el rendimiento de aprendizaje al aplicar un algoritmo de clonación de comportamiento a un algoritmo A2C en juegos de baloncesto. Se utilizan enfoques de normalización de estado, función de recompensa y clasificación de episodios con el A2C basado en clonación de comportamiento. Los resultados de los experimentos comparativos con los algoritmos A2C tradicionales validaron el método propuesto. Nuestro método propuesto utilizando enfoques existentes resolvió la dificultad de aprendizaje en juegos de baloncesto.
Descripción
La investigación sobre la aplicación de inteligencia artificial (IA) en los juegos ha ganado impulso recientemente. La mayoría de los juegos comerciales todavía utilizan IA basada en una máquina de estados finitos (FSM) debido a consideraciones de complejidad y coste. Sin embargo, la IA basada en FSM disminuye la satisfacción del usuario dado que realiza los mismos patrones de acciones consecutivas en las mismas situaciones. Esto hace necesario un nuevo enfoque de IA que aplique conocimientos específicos del dominio a algoritmos existentes de aprendizaje por refuerzo. Proponemos un enfoque A2C basado en clonación de comportamiento que mejora el rendimiento de aprendizaje al aplicar un algoritmo de clonación de comportamiento a un algoritmo A2C en juegos de baloncesto. Se utilizan enfoques de normalización de estado, función de recompensa y clasificación de episodios con el A2C basado en clonación de comportamiento. Los resultados de los experimentos comparativos con los algoritmos A2C tradicionales validaron el método propuesto. Nuestro método propuesto utilizando enfoques existentes resolvió la dificultad de aprendizaje en juegos de baloncesto.