Estrategia de Captura de Planificación de Coordinación de Pose Basada en Aprendizaje por Refuerzo para Objetivos No Cooperativos en el Espacio
Autores: Peng, Zhaotao; Wang, Chen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Estrategia de Captura de Planificación de Coordinación de Pose Basada en Aprendizaje por Refuerzo para Objetivos No Cooperativos en el Espacio
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Proceso
Robots espaciales
Efector final
Aprendizaje de estrategias de captura
Planificación de posturas
Entorno de prueba de simulación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Durante el proceso de captura de objetivos no cooperativos en el espacio, los robots espaciales tienen restricciones estrictas sobre la posición y orientación del efector final. Los métodos tradicionales suelen centrarse únicamente en el control de posición del efector final, lo que dificulta satisfacer simultáneamente los requisitos precisos tanto para la posición de captura como para la postura, lo que puede llevar a acciones de agarre fallidas o inestables. Para abordar este problema, este artículo propone un método de aprendizaje de estrategia de captura basado en refuerzo, combinado con planificación de postura. Primero, se construyen los modelos estructurales y dinámicos del mecanismo de captura. Luego, se diseña un modelo de control de decisión de extremo a extremo basado en el algoritmo Optimistic Actor-Critic (OAC) e integrado con un módulo de planificación de postura de captura. Esto permite que el proceso de aprendizaje de la estrategia planifique razonablemente la postura del efector final para adaptarse a las complejas restricciones de la tarea de captura del objetivo. Finalmente, se establece un entorno de prueba de simulación en la plataforma Mujoco, y se realizan entrenamientos y validaciones. Los resultados de la simulación demuestran que el modelo puede acercarse y capturar efectivamente múltiples objetivos con diferentes posturas, verificando la efectividad del método propuesto.
Descripción
Durante el proceso de captura de objetivos no cooperativos en el espacio, los robots espaciales tienen restricciones estrictas sobre la posición y orientación del efector final. Los métodos tradicionales suelen centrarse únicamente en el control de posición del efector final, lo que dificulta satisfacer simultáneamente los requisitos precisos tanto para la posición de captura como para la postura, lo que puede llevar a acciones de agarre fallidas o inestables. Para abordar este problema, este artículo propone un método de aprendizaje de estrategia de captura basado en refuerzo, combinado con planificación de postura. Primero, se construyen los modelos estructurales y dinámicos del mecanismo de captura. Luego, se diseña un modelo de control de decisión de extremo a extremo basado en el algoritmo Optimistic Actor-Critic (OAC) e integrado con un módulo de planificación de postura de captura. Esto permite que el proceso de aprendizaje de la estrategia planifique razonablemente la postura del efector final para adaptarse a las complejas restricciones de la tarea de captura del objetivo. Finalmente, se establece un entorno de prueba de simulación en la plataforma Mujoco, y se realizan entrenamientos y validaciones. Los resultados de la simulación demuestran que el modelo puede acercarse y capturar efectivamente múltiples objetivos con diferentes posturas, verificando la efectividad del método propuesto.