Escalable asignación de tareas multirobot utilizando aprendizaje profundo de refuerzo con normalización de gráficos
Autores: Zhang, Zhenqiang; Jiang, Xiangyuan; Yang, Zhenfa; Ma, Sile; Chen, Jiyang; Sun, Wenxu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Escalable asignación de tareas multirobot utilizando aprendizaje profundo de refuerzo con normalización de gráficos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Asignación de tareas
Sistemas multi-robot
Aprendizaje profundo por refuerzo
Técnica de normalización de gráficos
Escalabilidad
Eficiencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
La asignación de tareas juega un papel importante en los sistemas multi-robot en cuanto a la eficiencia del equipo. Los métodos heurísticos o metaheurísticos convencionales enfrentan dificultades para generar soluciones satisfactorias en un tiempo computacional razonable, especialmente para problemas de asignación de tareas multi-robot a gran escala. Este artículo propone un enfoque novedoso basado en aprendizaje profundo por refuerzo en grafo, que resuelve el problema a través del aprendizaje. El marco aprovecha el concepto de muestra y agregación de grafo como codificador para extraer las características de los nodos en el contexto del grafo, seguido por un decodificador de atención cruzada para producir la probabilidad de que cada tarea sea asignada a cada robot. También se propone una técnica de normalización de grafo antes de la entrada, lo que permite una fácil adaptación a aplicaciones del mundo real, y se puede garantizar una solución determinista. La ventaja más importante de esta arquitectura es la escalabilidad y el carácter rápido de avance; independientemente de si los casos tienen un número variable de robots o tareas, depósitos individuales, múltiples depósitos o incluso depósitos individuales y múltiples mixtos, las soluciones pueden producirse con poco esfuerzo computacional. La alta eficiencia y robustez del método propuesto se confirman mediante experimentos extensos en este artículo, y varios escenarios de asignación de tareas multi-robot demuestran su ventaja.
Descripción
La asignación de tareas juega un papel importante en los sistemas multi-robot en cuanto a la eficiencia del equipo. Los métodos heurísticos o metaheurísticos convencionales enfrentan dificultades para generar soluciones satisfactorias en un tiempo computacional razonable, especialmente para problemas de asignación de tareas multi-robot a gran escala. Este artículo propone un enfoque novedoso basado en aprendizaje profundo por refuerzo en grafo, que resuelve el problema a través del aprendizaje. El marco aprovecha el concepto de muestra y agregación de grafo como codificador para extraer las características de los nodos en el contexto del grafo, seguido por un decodificador de atención cruzada para producir la probabilidad de que cada tarea sea asignada a cada robot. También se propone una técnica de normalización de grafo antes de la entrada, lo que permite una fácil adaptación a aplicaciones del mundo real, y se puede garantizar una solución determinista. La ventaja más importante de esta arquitectura es la escalabilidad y el carácter rápido de avance; independientemente de si los casos tienen un número variable de robots o tareas, depósitos individuales, múltiples depósitos o incluso depósitos individuales y múltiples mixtos, las soluciones pueden producirse con poco esfuerzo computacional. La alta eficiencia y robustez del método propuesto se confirman mediante experimentos extensos en este artículo, y varios escenarios de asignación de tareas multi-robot demuestran su ventaja.