Estrategia de Control Inteligente para Manta Robótica a través de CPG y Aprendizaje por Refuerzo Profundo
Autores: Su, Shijie; Chen, Yushuo; Li, Cunjun; Ni, Kai; Zhang, Jian
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Estrategia de Control Inteligente para Manta Robótica a través de CPG y Aprendizaje por Refuerzo Profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Manta robótica
Maniobrabilidad
Eficiencia de nado
Sigilosidad
Gradiente de Política Determinista Profunda
Generadores de Patrones Centrales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La manta robótica ha atraído un interés significativo por su excepcional maniobrabilidad, eficiencia de nado y sigilo. Sin embargo, lograr un nado autónomo eficiente en entornos submarinos complejos presenta un desafío importante. Para abordar este problema, este estudio integra el Gradiente de Política Determinista Profunda (DDPG) con Generadores de Patrones Centrales (CPGs) y propone una estrategia de control DDPG basada en CPG. Primero, diseñamos una estrategia de control CPG que puede imitar con mayor precisión el comportamiento de nado de la manta. Luego, implementamos el algoritmo DDPG como un controlador de alto nivel que modifica adaptativamente los parámetros de control del CPG en función de la información del estado en tiempo real de la manta robótica. Este ajuste permite regular los modos de nado para cumplir tareas específicas. La estrategia propuesta pasó por un entrenamiento y pruebas iniciales en un entorno simulado antes de su implementación en un prototipo de manta robótica para ensayos de campo. Tanto los resultados de simulación como los experimentales validan la efectividad y la practicidad de la estrategia de control propuesta.
Descripción
La manta robótica ha atraído un interés significativo por su excepcional maniobrabilidad, eficiencia de nado y sigilo. Sin embargo, lograr un nado autónomo eficiente en entornos submarinos complejos presenta un desafío importante. Para abordar este problema, este estudio integra el Gradiente de Política Determinista Profunda (DDPG) con Generadores de Patrones Centrales (CPGs) y propone una estrategia de control DDPG basada en CPG. Primero, diseñamos una estrategia de control CPG que puede imitar con mayor precisión el comportamiento de nado de la manta. Luego, implementamos el algoritmo DDPG como un controlador de alto nivel que modifica adaptativamente los parámetros de control del CPG en función de la información del estado en tiempo real de la manta robótica. Este ajuste permite regular los modos de nado para cumplir tareas específicas. La estrategia propuesta pasó por un entrenamiento y pruebas iniciales en un entorno simulado antes de su implementación en un prototipo de manta robótica para ensayos de campo. Tanto los resultados de simulación como los experimentales validan la efectividad y la practicidad de la estrategia de control propuesta.