Aprendizaje reforzado distribucional con conjuntos
Autores: Lindenberg, Björn; Nordqvist, Jonas; Lindahl, Karl-Olof
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Aprendizaje reforzado distribucional con conjuntos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Métodos de conjunto
Aprendizaje por refuerzo
Entrenamiento asistido por grupo
Aprendizaje por refuerzo distribucional
Aprendizaje por refuerzo categórico
Aprendizaje inicial robusto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Es bien sabido que los métodos de conjunto a menudo proporcionan un rendimiento mejorado en el aprendizaje por refuerzo. En este documento, exploramos este concepto aún más utilizando el entrenamiento asistido por grupo dentro del paradigma del aprendizaje por refuerzo distribucional. Específicamente, proponemos una extensión al aprendizaje por refuerzo categórico, donde los objetivos de aprendizaje distribucional se basan implícitamente en la información total recopilada por un conjunto. Mostramos empíricamente que esto puede llevar a un aprendizaje inicial mucho más robusto, un nivel de rendimiento individual más fuerte y una buena eficiencia en una base por muestra.
Descripción
Es bien sabido que los métodos de conjunto a menudo proporcionan un rendimiento mejorado en el aprendizaje por refuerzo. En este documento, exploramos este concepto aún más utilizando el entrenamiento asistido por grupo dentro del paradigma del aprendizaje por refuerzo distribucional. Específicamente, proponemos una extensión al aprendizaje por refuerzo categórico, donde los objetivos de aprendizaje distribucional se basan implícitamente en la información total recopilada por un conjunto. Mostramos empíricamente que esto puede llevar a un aprendizaje inicial mucho más robusto, un nivel de rendimiento individual más fuerte y una buena eficiencia en una base por muestra.