Un método para la estimación de la pose de objetos no vistos en seis grados de libertad basado en el modelo Segment Anything y la optimización híbrida de distancias
Autores: Xin, Li; Lin, Hu; Liu, Xinjun; Wang, Shiyu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un método para la estimación de la pose de objetos no vistos en seis grados de libertad basado en el modelo Segment Anything y la optimización híbrida de distancias
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Grados de libertad
Estimación de postura
6-dof
Datos RGB-D
Modelos CAD
Segmentación de instancias
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 47
Citaciones: Sin citaciones
La tecnología de estimación de la pose de seis grados de libertad constituye la piedra angular para el control robótico preciso y tareas similares. Abordando las limitaciones de los métodos actuales de estimación de pose de 6-DoF en el manejo de oclusiones de objetos y objetos desconocidos, hemos desarrollado un novedoso método de estimación de pose de 6-DoF en dos etapas que integra datos RGB-D con modelos CAD. Inicialmente, apuntando a tareas de segmentación de instancias de objetos de alta calidad sin necesidad de entrenamiento, innovamos el modelo CAE-SAM basado en el marco SAM. Al abordar el desenfoque de límites del modelo SAM, los vacíos de máscara y los problemas de sobre-segmentación, este documento introduce estrategias innovadoras como módulos de mejora de características espaciales locales, marcadores de contexto global y un generador de cuadros delimitadores. Posteriormente, propusimos un método de registro optimizado a través de una métrica de distancia híbrida para disminuir la dependencia de los algoritmos de registro de nube de puntos en hiperparámetros sensibles. Los resultados experimentales en el conjunto de datos HQSeg-44K respaldan las mejoras notables en precisión y robustez de la segmentación de instancias proporcionadas por el modelo CAE-SAM. Además, la eficacia de este método en dos etapas se corrobora aún más utilizando un conjunto de datos de pose de 6-DoF de piezas de trabajo construidas con CloudCompare y RealSense. Para objetivos no vistos, la métrica ADD logró 2,973 mm y la métrica ADD-S alcanzó 1,472 mm. Este documento mejora significativamente el rendimiento de la estimación de pose y simplifica los procedimientos de implementación y mantenimiento del algoritmo.
Descripción
La tecnología de estimación de la pose de seis grados de libertad constituye la piedra angular para el control robótico preciso y tareas similares. Abordando las limitaciones de los métodos actuales de estimación de pose de 6-DoF en el manejo de oclusiones de objetos y objetos desconocidos, hemos desarrollado un novedoso método de estimación de pose de 6-DoF en dos etapas que integra datos RGB-D con modelos CAD. Inicialmente, apuntando a tareas de segmentación de instancias de objetos de alta calidad sin necesidad de entrenamiento, innovamos el modelo CAE-SAM basado en el marco SAM. Al abordar el desenfoque de límites del modelo SAM, los vacíos de máscara y los problemas de sobre-segmentación, este documento introduce estrategias innovadoras como módulos de mejora de características espaciales locales, marcadores de contexto global y un generador de cuadros delimitadores. Posteriormente, propusimos un método de registro optimizado a través de una métrica de distancia híbrida para disminuir la dependencia de los algoritmos de registro de nube de puntos en hiperparámetros sensibles. Los resultados experimentales en el conjunto de datos HQSeg-44K respaldan las mejoras notables en precisión y robustez de la segmentación de instancias proporcionadas por el modelo CAE-SAM. Además, la eficacia de este método en dos etapas se corrobora aún más utilizando un conjunto de datos de pose de 6-DoF de piezas de trabajo construidas con CloudCompare y RealSense. Para objetivos no vistos, la métrica ADD logró 2,973 mm y la métrica ADD-S alcanzó 1,472 mm. Este documento mejora significativamente el rendimiento de la estimación de pose y simplifica los procedimientos de implementación y mantenimiento del algoritmo.