logo móvil
Contáctanos

Swarm de AUV distribuido energéticamente eficiente para el seguimiento de objetivos a través de aprendizaje por refuerzo asistido por LSTM de offline a online

Autores: Li, Renbo; Li, Denghui; Zhang, Xiangxin; Ni, Weiming

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Swarm de AUV distribuido energéticamente eficiente para el seguimiento de objetivos a través de aprendizaje por refuerzo asistido por LSTM de offline a online


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Vehículos submarinos autónomos
Aprendizaje por refuerzo multiagente
Enjambres de AUV
Consumo de energía
Red LSTM
Precisión de seguimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
En los últimos años, los vehículos autónomos submarinos (AUV) se han empleado cada vez más para la vigilancia y el seguimiento de objetivos. Sin embargo, el rendimiento limitado y la capacidad de procesamiento de información de un solo AUV dificultan lograr un seguimiento de alta precisión en la práctica. Para abordar estos desafíos, este documento propone un marco de aprendizaje por refuerzo multiagente en línea a fuera de línea (MARL) que emplea entrenamiento fuera de línea en datos históricos para obtener la política experta. Luego, la política óptima se genera mediante tecnología de ajuste fino en línea, lo que mejora la eficiencia de entrenamiento del aprendizaje por refuerzo en nuevos escenarios. Para expandir el rango de vigilancia de los enjambres de AUV, se introduce una estrategia cooperativa distribuida basada en la entropía de información del área (AIE). Para reducir el consumo de energía en entornos marinos complejos que contienen obstáculos y vórtices, se introducen modelos de corriente oceánica y consumo de energía, junto con una estrategia de optimización de eficiencia energética. Además, se integra una red de memoria a largo y corto plazo (LSTM) en el marco MARL de fuera de línea a en línea para predecir estados ambientales variables en el tiempo, mejorando así la precisión del seguimiento y la eficiencia energética. Los resultados experimentales muestran que el esquema propuesto es superior a los esquemas de referencia en términos de consumo de energía, tasa de éxito de tareas y distancia entre AUV. Además, varios indicadores de rendimiento del enjambre de AUV extendido también son superiores a los esquemas de referencia, demostrando que el esquema propuesto tiene un excelente rendimiento y escalabilidad.

Otros recursos que podrían interesarte

Temas Virtualpro