Asignación dinámica de objetivos por vehículos superficiales no tripulados basada en aprendizaje por refuerzo
Autores: Hu, Tao; Zhang, Xiaoxue; Luo, Xueshan; Chen, Tao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Asignación dinámica de objetivos por vehículos superficiales no tripulados basada en aprendizaje por refuerzo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Complejidades dinámicas
Embarcación multi-no tripulada
Algoritmo de aprendizaje por refuerzo
Mecanismos de autoatención
Modelo de embarcación no tripulada offshore
Algoritmo genético
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Debido a las complejidades dinámicas del problema de asignación de objetivos de múltiples embarcaciones no tripuladas en el mar, especialmente al abordar objetivos en movimiento, los algoritmos de optimización tradicionales a menudo no logran encontrar rápidamente una solución adecuada. Para superar esto, hemos desarrollado un algoritmo de aprendizaje por refuerzo de múltiples agentes. Este enfoque implica definir un espacio de estados, emplear la repetición de experiencias preferencial e integrar mecanismos de autoatención, que se aplican a un nuevo modelo de embarcación no tripulada en alta mar diseñado para la asignación dinámica de objetivos. Hemos realizado un análisis exhaustivo de posiciones y tiempos de ataque, estableciendo modelos matemáticos sólidos. Además, diseñamos varios experimentos para probar la efectividad del algoritmo. El algoritmo propuesto mejora la calidad de la solución en al menos un 30% en escenarios a mayor escala en comparación con el algoritmo genético (GA), y la velocidad promedio de la solución es inferior al 10% del GA, lo que demuestra la viabilidad del algoritmo para resolver el problema.
Descripción
Debido a las complejidades dinámicas del problema de asignación de objetivos de múltiples embarcaciones no tripuladas en el mar, especialmente al abordar objetivos en movimiento, los algoritmos de optimización tradicionales a menudo no logran encontrar rápidamente una solución adecuada. Para superar esto, hemos desarrollado un algoritmo de aprendizaje por refuerzo de múltiples agentes. Este enfoque implica definir un espacio de estados, emplear la repetición de experiencias preferencial e integrar mecanismos de autoatención, que se aplican a un nuevo modelo de embarcación no tripulada en alta mar diseñado para la asignación dinámica de objetivos. Hemos realizado un análisis exhaustivo de posiciones y tiempos de ataque, estableciendo modelos matemáticos sólidos. Además, diseñamos varios experimentos para probar la efectividad del algoritmo. El algoritmo propuesto mejora la calidad de la solución en al menos un 30% en escenarios a mayor escala en comparación con el algoritmo genético (GA), y la velocidad promedio de la solución es inferior al 10% del GA, lo que demuestra la viabilidad del algoritmo para resolver el problema.