Acoplamiento de Vehículos Submarinos Autónomos Bajo Suposiciones Realistas Utilizando Aprendizaje por Refuerzo Profundo
Autores: Palomeras, Narcís; Ridao, Pere
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Acoplamiento de Vehículos Submarinos Autónomos Bajo Suposiciones Realistas Utilizando Aprendizaje por Refuerzo Profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Papel
Vehículo autónomo submarino
Aprendizaje profundo por refuerzo
Acoplamiento
Observaciones
Algoritmos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento aborda el desafío de acoplar un Vehículo Submarino Autónomo (AUV) en condiciones realistas. Los controladores tradicionales basados en modelos a menudo están limitados por la complejidad y variabilidad del entorno oceánico. Para superar estas limitaciones, proponemos un enfoque de Aprendizaje por Refuerzo Profundo (DRL) para gestionar la maniobra de aproximación y acoplamiento. Primero, definimos la tarea de acoplamiento propuesta en términos de sus observaciones, acciones y función de recompensa, con el objetivo de cerrar la brecha entre la investigación teórica en DRL y los algoritmos de acoplamiento probados en vehículos reales. Además, introducimos un nuevo espacio de observación que combina observaciones ruidosas en bruto con datos filtrados obtenidos mediante un Filtro de Kalman Extendido (EKF). Demostramos la efectividad de este enfoque a través de simulaciones con varios algoritmos de DRL, mostrando que las observaciones propuestas pueden producir políticas estables en menos pasos de aprendizaje, superando no solo los métodos de control tradicionales, sino también las políticas obtenidas por los mismos algoritmos de DRL en entornos sin ruido.
Descripción
Este documento aborda el desafío de acoplar un Vehículo Submarino Autónomo (AUV) en condiciones realistas. Los controladores tradicionales basados en modelos a menudo están limitados por la complejidad y variabilidad del entorno oceánico. Para superar estas limitaciones, proponemos un enfoque de Aprendizaje por Refuerzo Profundo (DRL) para gestionar la maniobra de aproximación y acoplamiento. Primero, definimos la tarea de acoplamiento propuesta en términos de sus observaciones, acciones y función de recompensa, con el objetivo de cerrar la brecha entre la investigación teórica en DRL y los algoritmos de acoplamiento probados en vehículos reales. Además, introducimos un nuevo espacio de observación que combina observaciones ruidosas en bruto con datos filtrados obtenidos mediante un Filtro de Kalman Extendido (EKF). Demostramos la efectividad de este enfoque a través de simulaciones con varios algoritmos de DRL, mostrando que las observaciones propuestas pueden producir políticas estables en menos pasos de aprendizaje, superando no solo los métodos de control tradicionales, sino también las políticas obtenidas por los mismos algoritmos de DRL en entornos sin ruido.