Manipulador de Espacio Redundante Guía Autónoma para el Servicio en Órbita a través del Aprendizaje por Refuerzo Profundo
Autores: D"Ambrosio, Matteo; Capra, Lorenzo; Brandonisio, Andrea; Silvestrini, Stefano; Lavagna, Michèle
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Manipulador de Espacio Redundante Guía Autónoma para el Servicio en Órbita a través del Aprendizaje por Refuerzo Profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Manipuladores robóticos espaciales
Autonomía
Servicio en órbita
Aprendizaje profundo por refuerzo
Generación de trayectorias
Optimización de políticas proximales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
La aplicación de manipuladores robóticos espaciales y una mayor autonomía para el Servicio en Órbita (IOS) representa una búsqueda primordial para las principales agencias espaciales, dado la amenaza sustancial que representa la basura espacial para los satélites operativos y los futuros esfuerzos espaciales. Este trabajo presenta un algoritmo de guía basado en Aprendizaje por Refuerzo Profundo (DRL) para resolver la planificación de trayectorias del manipulador espacial durante la fase de sincronización de movimiento con el objetivo de la misión. El objetivo es la generación y control de la trayectoria de una nave espacial equipada con un manipulador robótico de 7 Grados de Libertad (7-DoF), de modo que su efector final permanezca estacionario con respecto al punto objetivo de captura. Se utiliza el algoritmo de Optimización de Política Proximal (PPO) de DRL para optimizar la ley de guía del manipulador, y el agente autónomo genera las tasas de articulación deseadas del brazo robótico, que luego se integran y se pasan a un controlador de linealización por retroalimentación basado en modelo. El agente se entrena primero para optimizar su política de guía y luego se prueba extensivamente para validar los resultados en un entorno simulado que representa el escenario de sincronización de movimiento de una misión IOS.
Descripción
La aplicación de manipuladores robóticos espaciales y una mayor autonomía para el Servicio en Órbita (IOS) representa una búsqueda primordial para las principales agencias espaciales, dado la amenaza sustancial que representa la basura espacial para los satélites operativos y los futuros esfuerzos espaciales. Este trabajo presenta un algoritmo de guía basado en Aprendizaje por Refuerzo Profundo (DRL) para resolver la planificación de trayectorias del manipulador espacial durante la fase de sincronización de movimiento con el objetivo de la misión. El objetivo es la generación y control de la trayectoria de una nave espacial equipada con un manipulador robótico de 7 Grados de Libertad (7-DoF), de modo que su efector final permanezca estacionario con respecto al punto objetivo de captura. Se utiliza el algoritmo de Optimización de Política Proximal (PPO) de DRL para optimizar la ley de guía del manipulador, y el agente autónomo genera las tasas de articulación deseadas del brazo robótico, que luego se integran y se pasan a un controlador de linealización por retroalimentación basado en modelo. El agente se entrena primero para optimizar su política de guía y luego se prueba extensivamente para validar los resultados en un entorno simulado que representa el escenario de sincronización de movimiento de una misión IOS.