Un sensor hexagonal y un método de conversión basado en capas para clústeres hexagonales
Autores: Kim, Jun-Ho; Sung, Hanul
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un sensor hexagonal y un método de conversión basado en capas para clústeres hexagonales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje por refuerzo
Observaciones
Unity ML-Agents
Clústeres hexagonales
Sensores
Método de conversión basado en capas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En el aprendizaje por refuerzo (RL), las observaciones precisas son cruciales para que los agentes aprendan la política óptima de su entorno. Aunque Unity ML-Agents ofrece varios componentes de sensores para ajustar automáticamente las observaciones, no soporta clústeres hexagonales, una característica común en los juegos de estrategia debido a sus propiedades geométricas ventajosas. Como resultado, los usuarios pueden intentar utilizar los sensores existentes para observar clústeres hexagonales, pero se encuentran con limitaciones significativas. Para abordar este problema, proponemos un sensor hexagonal y un método de conversión basado en capas que permiten a los usuarios observar clústeres hexagonales con facilidad. Al organizar las celdas hexagonales en capas estructuradas, nuestro enfoque asegura un manejo eficiente de la observación y la coherencia espacial. Proporcionamos una adaptación flexible a diferentes tamaños de observación, lo que permite la creación de diversos diseños de mapas estratégicos. Nuestras evaluaciones demuestran que el sensor hexagonal, combinado con el método de conversión basado en capas, logra una velocidad de aprendizaje hasta 1.4 veces más rápida y genera hasta el doble de recompensas en comparación con los sensores convencionales. Además, el rendimiento de inferencia se mejora hasta 1.5 veces, validando aún más la efectividad de nuestro enfoque.
Descripción
En el aprendizaje por refuerzo (RL), las observaciones precisas son cruciales para que los agentes aprendan la política óptima de su entorno. Aunque Unity ML-Agents ofrece varios componentes de sensores para ajustar automáticamente las observaciones, no soporta clústeres hexagonales, una característica común en los juegos de estrategia debido a sus propiedades geométricas ventajosas. Como resultado, los usuarios pueden intentar utilizar los sensores existentes para observar clústeres hexagonales, pero se encuentran con limitaciones significativas. Para abordar este problema, proponemos un sensor hexagonal y un método de conversión basado en capas que permiten a los usuarios observar clústeres hexagonales con facilidad. Al organizar las celdas hexagonales en capas estructuradas, nuestro enfoque asegura un manejo eficiente de la observación y la coherencia espacial. Proporcionamos una adaptación flexible a diferentes tamaños de observación, lo que permite la creación de diversos diseños de mapas estratégicos. Nuestras evaluaciones demuestran que el sensor hexagonal, combinado con el método de conversión basado en capas, logra una velocidad de aprendizaje hasta 1.4 veces más rápida y genera hasta el doble de recompensas en comparación con los sensores convencionales. Además, el rendimiento de inferencia se mejora hasta 1.5 veces, validando aún más la efectividad de nuestro enfoque.