Manipulador de Espacio Redundante Guía Autónoma para el Servicio en Órbita a través del Aprendizaje por Refuerzo Profundo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Manipulador de Espacio Redundante Guía Autónoma para el Servicio en Órbita a través del Aprendizaje por Refuerzo Profundo

Autores: D"Ambrosio, Matteo; Capra, Lorenzo; Brandonisio, Andrea; Silvestrini, Stefano; Lavagna, Michèle

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Manipulador de Espacio Redundante Guía Autónoma para el Servicio en Órbita a través del Aprendizaje por Refuerzo Profundo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Manipuladores robóticos espaciales

Autonomía

Servicio en órbita

Aprendizaje profundo por refuerzo

Generación de trayectorias

Optimización de políticas proximales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 15

Citaciones: Sin citaciones

La aplicación de manipuladores robóticos espaciales y una mayor autonomía para el Servicio en Órbita (IOS) representa una búsqueda primordial para las principales agencias espaciales, dado la amenaza sustancial que representa la basura espacial para los satélites operativos y los futuros esfuerzos espaciales. Este trabajo presenta un algoritmo de guía basado en Aprendizaje por Refuerzo Profundo (DRL) para resolver la planificación de trayectorias del manipulador espacial durante la fase de sincronización de movimiento con el objetivo de la misión. El objetivo es la generación y control de la trayectoria de una nave espacial equipada con un manipulador robótico de 7 Grados de Libertad (7-DoF), de modo que su efector final permanezca estacionario con respecto al punto objetivo de captura. Se utiliza el algoritmo de Optimización de Política Proximal (PPO) de DRL para optimizar la ley de guía del manipulador, y el agente autónomo genera las tasas de articulación deseadas del brazo robótico, que luego se integran y se pasan a un controlador de linealización por retroalimentación basado en modelo. El agente se entrena primero para optimizar su política de guía y luego se prueba extensivamente para validar los resultados en un entorno simulado que representa el escenario de sincronización de movimiento de una misión IOS.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro