Una encuesta sobre el aprendizaje profundo de refuerzo multitarea
Autores: Vithayathil Varghese, Nelson; Mahmoud, Qusay H.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Una encuesta sobre el aprendizaje profundo de refuerzo multitarea
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Avances tecnológicos
Investigación en inteligencia artificial
Aprendizaje profundo
Aprendizaje por refuerzo
Aprendizaje profundo por refuerzo
Enfoques sin modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Impulsado por los recientes avances tecnológicos dentro del campo de la investigación en inteligencia artificial, el aprendizaje profundo ha surgido como una técnica prometedora de aprendizaje de representaciones en todas las clases de aprendizaje automático, especialmente dentro del ámbito del aprendizaje por refuerzo. Esta nueva dirección ha dado lugar a la evolución de un nuevo dominio tecnológico denominado aprendizaje profundo por refuerzo, que combina el poder de aprendizaje representacional del aprendizaje profundo con los métodos existentes de aprendizaje por refuerzo. Sin duda, el inicio del aprendizaje profundo por refuerzo ha desempeñado un papel vital en la optimización del rendimiento de agentes inteligentes basados en aprendizaje por refuerzo con enfoques basados en modelos libres. Aunque estos métodos podrían mejorar el rendimiento de los agentes en gran medida, estaban principalmente limitados a sistemas que adoptaban algoritmos de aprendizaje por refuerzo centrados en aprender una sola tarea. Al mismo tiempo, se descubrió que el enfoque mencionado era relativamente ineficiente en datos, especialmente cuando los agentes de aprendizaje por refuerzo necesitaban interactuar con entornos de datos más complejos y ricos. Esto se debe principalmente a la limitada aplicabilidad de los algoritmos de aprendizaje profundo por refuerzo en muchos escenarios a través de tareas relacionadas del mismo entorno. El objetivo de este documento es examinar los desafíos de investigación asociados con el multitarea dentro del ámbito del aprendizaje profundo por refuerzo y presentar los enfoques de vanguardia comparando y contrastando soluciones recientes, a saber, DISTRAL (DIStill & TRAnsfer Learning), IMPALA (Importance Weighted Actor-Learner Architecture) y PopArt que tienen como objetivo abordar desafíos fundamentales como la escalabilidad, el dilema de la distracción, la observabilidad parcial, el olvido catastrófico y la transferencia negativa de conocimiento.
Descripción
Impulsado por los recientes avances tecnológicos dentro del campo de la investigación en inteligencia artificial, el aprendizaje profundo ha surgido como una técnica prometedora de aprendizaje de representaciones en todas las clases de aprendizaje automático, especialmente dentro del ámbito del aprendizaje por refuerzo. Esta nueva dirección ha dado lugar a la evolución de un nuevo dominio tecnológico denominado aprendizaje profundo por refuerzo, que combina el poder de aprendizaje representacional del aprendizaje profundo con los métodos existentes de aprendizaje por refuerzo. Sin duda, el inicio del aprendizaje profundo por refuerzo ha desempeñado un papel vital en la optimización del rendimiento de agentes inteligentes basados en aprendizaje por refuerzo con enfoques basados en modelos libres. Aunque estos métodos podrían mejorar el rendimiento de los agentes en gran medida, estaban principalmente limitados a sistemas que adoptaban algoritmos de aprendizaje por refuerzo centrados en aprender una sola tarea. Al mismo tiempo, se descubrió que el enfoque mencionado era relativamente ineficiente en datos, especialmente cuando los agentes de aprendizaje por refuerzo necesitaban interactuar con entornos de datos más complejos y ricos. Esto se debe principalmente a la limitada aplicabilidad de los algoritmos de aprendizaje profundo por refuerzo en muchos escenarios a través de tareas relacionadas del mismo entorno. El objetivo de este documento es examinar los desafíos de investigación asociados con el multitarea dentro del ámbito del aprendizaje profundo por refuerzo y presentar los enfoques de vanguardia comparando y contrastando soluciones recientes, a saber, DISTRAL (DIStill & TRAnsfer Learning), IMPALA (Importance Weighted Actor-Learner Architecture) y PopArt que tienen como objetivo abordar desafíos fundamentales como la escalabilidad, el dilema de la distracción, la observabilidad parcial, el olvido catastrófico y la transferencia negativa de conocimiento.