Un sensor hexagonal y un método de conversión basado en capas para clústeres hexagonales

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un sensor hexagonal y un método de conversión basado en capas para clústeres hexagonales

Autores: Kim, Jun-Ho; Sung, Hanul

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Un sensor hexagonal y un método de conversión basado en capas para clústeres hexagonales

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Aprendizaje por refuerzo

Observaciones

Unity ML-Agents

Clústeres hexagonales

Sensores

Método de conversión basado en capas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

En el aprendizaje por refuerzo (RL), las observaciones precisas son cruciales para que los agentes aprendan la política óptima de su entorno. Aunque Unity ML-Agents ofrece varios componentes de sensores para ajustar automáticamente las observaciones, no soporta clústeres hexagonales, una característica común en los juegos de estrategia debido a sus propiedades geométricas ventajosas. Como resultado, los usuarios pueden intentar utilizar los sensores existentes para observar clústeres hexagonales, pero se encuentran con limitaciones significativas. Para abordar este problema, proponemos un sensor hexagonal y un método de conversión basado en capas que permiten a los usuarios observar clústeres hexagonales con facilidad. Al organizar las celdas hexagonales en capas estructuradas, nuestro enfoque asegura un manejo eficiente de la observación y la coherencia espacial. Proporcionamos una adaptación flexible a diferentes tamaños de observación, lo que permite la creación de diversos diseños de mapas estratégicos. Nuestras evaluaciones demuestran que el sensor hexagonal, combinado con el método de conversión basado en capas, logra una velocidad de aprendizaje hasta 1.4 veces más rápida y genera hasta el doble de recompensas en comparación con los sensores convencionales. Además, el rendimiento de inferencia se mejora hasta 1.5 veces, validando aún más la efectividad de nuestro enfoque.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro