Multiagente maniobrando con el uso de aprendizaje por refuerzo
Autores: Orowski, Mateusz; Skruch, Pawe
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Multiagente maniobrando con el uso de aprendizaje por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Enfoque
Problemas de maniobra cooperativa dinámica
Aplicaciones de conducción autónoma
Técnica de aprendizaje por refuerzo
Sistema multiagente
Agentes tipo automóvil
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
Este documento presenta un enfoque para definir, resolver e implementar problemas de maniobras cooperativas dinámicas en aplicaciones de conducción autónoma. La formulación de estos problemas considera un conjunto de coches cooperantes como parte de un sistema multiagente. Se aplica una técnica de aprendizaje por refuerzo para encontrar una política subóptima. El papel clave en el enfoque presentado es un entorno de maniobra multiagente que permite la simulación de agentes tipo coche dentro de un espacio limitado por obstáculos. A cada uno de los agentes se le asigna alcanzar un objetivo individual, definido como una ubicación específica en el espacio. La política se determina durante el proceso de aprendizaje por refuerzo para alcanzar una posición de objetivo predeterminada para cada uno de los coches simulados. En los experimentos, se utilizaron tres escenarios de carretera -cierre, cuello de botella y cruces. La política entrenada ha tenido éxito en resolver el problema de cooperación en todos los escenarios y se han presentado y estudiado los efectos positivos de aplicar recompensas compartidas entre agentes. Los resultados obtenidos en este trabajo brindan una oportunidad para diversas aplicaciones automotrices.
Descripción
Este documento presenta un enfoque para definir, resolver e implementar problemas de maniobras cooperativas dinámicas en aplicaciones de conducción autónoma. La formulación de estos problemas considera un conjunto de coches cooperantes como parte de un sistema multiagente. Se aplica una técnica de aprendizaje por refuerzo para encontrar una política subóptima. El papel clave en el enfoque presentado es un entorno de maniobra multiagente que permite la simulación de agentes tipo coche dentro de un espacio limitado por obstáculos. A cada uno de los agentes se le asigna alcanzar un objetivo individual, definido como una ubicación específica en el espacio. La política se determina durante el proceso de aprendizaje por refuerzo para alcanzar una posición de objetivo predeterminada para cada uno de los coches simulados. En los experimentos, se utilizaron tres escenarios de carretera -cierre, cuello de botella y cruces. La política entrenada ha tenido éxito en resolver el problema de cooperación en todos los escenarios y se han presentado y estudiado los efectos positivos de aplicar recompensas compartidas entre agentes. Los resultados obtenidos en este trabajo brindan una oportunidad para diversas aplicaciones automotrices.