Aprendizaje por Refuerzo Basado en la Fijación de Formación y Transformación de Forma para Enjambres
Autores: Dong, Zhaoqi; Wu, Qizhen; Chen, Lei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje por Refuerzo Basado en la Fijación de Formación y Transformación de Forma para Enjambres
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Modelos de enjambre
Comportamiento emergente
Modelo de boids
Aprendizaje por refuerzo
Enjambres de drones
Red de q-learning
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los modelos de enjambre tienen una importancia significativa ya que proporcionan el comportamiento colectivo de sistemas autoorganizados. El modelo Boids es un marco fundamental para estudiar el comportamiento emergente en sistemas de enjambre. Aborda problemas relacionados con la simulación del comportamiento emergente de agentes autónomos, como la alineación, la cohesión y la repulsión, para imitar los movimientos naturales de agrupamiento. Sin embargo, los modelos tradicionales de Boids a menudo carecen de fijación y de la adaptabilidad para adaptarse rápidamente al entorno dinámico. Para abordar esta limitación, introducimos el aprendizaje por refuerzo en el marco de Boids para resolver el problema del desorden y la falta de fijación. El objetivo de este enfoque es permitir que los enjambres de drones se adapten rápida y eficazmente a entornos externos dinámicos. Proponemos un método basado en la red de Q-learning para mejorar los parámetros de cohesión y repulsión en el modelo Boids para lograr una evitación continua de obstáculos y maximizar la cobertura espacial en el escenario de simulación. Además, introducimos un líder virtual para proporcionar fijación y estabilidad en la coordinación, reflejando el liderazgo y la coordinación observados en los enjambres de drones. Para validar la efectividad de este método, demostramos las capacidades del modelo a través de experimentos empíricos con enjambres de drones y mostramos la practicidad del marco RL-Boids.
Descripción
Los modelos de enjambre tienen una importancia significativa ya que proporcionan el comportamiento colectivo de sistemas autoorganizados. El modelo Boids es un marco fundamental para estudiar el comportamiento emergente en sistemas de enjambre. Aborda problemas relacionados con la simulación del comportamiento emergente de agentes autónomos, como la alineación, la cohesión y la repulsión, para imitar los movimientos naturales de agrupamiento. Sin embargo, los modelos tradicionales de Boids a menudo carecen de fijación y de la adaptabilidad para adaptarse rápidamente al entorno dinámico. Para abordar esta limitación, introducimos el aprendizaje por refuerzo en el marco de Boids para resolver el problema del desorden y la falta de fijación. El objetivo de este enfoque es permitir que los enjambres de drones se adapten rápida y eficazmente a entornos externos dinámicos. Proponemos un método basado en la red de Q-learning para mejorar los parámetros de cohesión y repulsión en el modelo Boids para lograr una evitación continua de obstáculos y maximizar la cobertura espacial en el escenario de simulación. Además, introducimos un líder virtual para proporcionar fijación y estabilidad en la coordinación, reflejando el liderazgo y la coordinación observados en los enjambres de drones. Para validar la efectividad de este método, demostramos las capacidades del modelo a través de experimentos empíricos con enjambres de drones y mostramos la practicidad del marco RL-Boids.