Swarm de AUV distribuido energéticamente eficiente para el seguimiento de objetivos a través de aprendizaje por refuerzo asistido por LSTM de offline a online

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Swarm de AUV distribuido energéticamente eficiente para el seguimiento de objetivos a través de aprendizaje por refuerzo asistido por LSTM de offline a online

Autores: Li, Renbo; Li, Denghui; Zhang, Xiangxin; Ni, Weiming

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico

2026

Swarm de AUV distribuido energéticamente eficiente para el seguimiento de objetivos a través de aprendizaje por refuerzo asistido por LSTM de offline a online

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Vehículos submarinos autónomos

Aprendizaje por refuerzo multiagente

Enjambres de AUV

Consumo de energía

Red LSTM

Precisión de seguimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

En los últimos años, los vehículos autónomos submarinos (AUV) se han empleado cada vez más para la vigilancia y el seguimiento de objetivos. Sin embargo, el rendimiento limitado y la capacidad de procesamiento de información de un solo AUV dificultan lograr un seguimiento de alta precisión en la práctica. Para abordar estos desafíos, este documento propone un marco de aprendizaje por refuerzo multiagente en línea a fuera de línea (MARL) que emplea entrenamiento fuera de línea en datos históricos para obtener la política experta. Luego, la política óptima se genera mediante tecnología de ajuste fino en línea, lo que mejora la eficiencia de entrenamiento del aprendizaje por refuerzo en nuevos escenarios. Para expandir el rango de vigilancia de los enjambres de AUV, se introduce una estrategia cooperativa distribuida basada en la entropía de información del área (AIE). Para reducir el consumo de energía en entornos marinos complejos que contienen obstáculos y vórtices, se introducen modelos de corriente oceánica y consumo de energía, junto con una estrategia de optimización de eficiencia energética. Además, se integra una red de memoria a largo y corto plazo (LSTM) en el marco MARL de fuera de línea a en línea para predecir estados ambientales variables en el tiempo, mejorando así la precisión del seguimiento y la eficiencia energética. Los resultados experimentales muestran que el esquema propuesto es superior a los esquemas de referencia en términos de consumo de energía, tasa de éxito de tareas y distancia entre AUV. Además, varios indicadores de rendimiento del enjambre de AUV extendido también son superiores a los esquemas de referencia, demostrando que el esquema propuesto tiene un excelente rendimiento y escalabilidad.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro