Un método de entrenamiento periódico para la asignación dinámica de tareas heterogéneas de UUV
Autores: Xie, Jiaxuan; Yang, Kai; Gao, Shan; Bao, Shixiong; Zuo, Lei; Wei, Xiangyu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un método de entrenamiento periódico para la asignación dinámica de tareas heterogéneas de UUV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Asignación dinámica de tareas
Vehículos submarinos no tripulados
Método de asignación heurística
Aprendizaje por refuerzo multiagente
Método de entrenamiento periódico
Emergencias
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
En la asignación dinámica de tareas de vehículos submarinos no tripulados (UUVs), los esquemas de UUVs deben ser reasignados rápidamente para responder a emergencias. El método de asignación heurística más común utiliza reglas de optimización predefinidas para obtener una solución de manera iterativa, lo cual es un proceso que consume tiempo. Para asignar rápidamente tareas a UUVs heterogéneos, proponemos un nuevo algoritmo de asignación de tareas basado en aprendizaje por refuerzo multiagente (MARL) y un método de entrenamiento por periodos (PTM). El método de entrenamiento por periodos (PTM) se utiliza para optimizar los parámetros de los modelos de MARL en diferentes entornos de entrenamiento, mejorando la robustez del algoritmo. Los resultados de la simulación muestran que los métodos propuestos pueden asignar tareas de manera efectiva a diferentes UUVs en pocos segundos y reasignar los esquemas en tiempo real para hacer frente a emergencias.
Descripción
En la asignación dinámica de tareas de vehículos submarinos no tripulados (UUVs), los esquemas de UUVs deben ser reasignados rápidamente para responder a emergencias. El método de asignación heurística más común utiliza reglas de optimización predefinidas para obtener una solución de manera iterativa, lo cual es un proceso que consume tiempo. Para asignar rápidamente tareas a UUVs heterogéneos, proponemos un nuevo algoritmo de asignación de tareas basado en aprendizaje por refuerzo multiagente (MARL) y un método de entrenamiento por periodos (PTM). El método de entrenamiento por periodos (PTM) se utiliza para optimizar los parámetros de los modelos de MARL en diferentes entornos de entrenamiento, mejorando la robustez del algoritmo. Los resultados de la simulación muestran que los métodos propuestos pueden asignar tareas de manera efectiva a diferentes UUVs en pocos segundos y reasignar los esquemas en tiempo real para hacer frente a emergencias.