Red de coincidencia estéreo de fusión adaptativa y atención de costo multi-escala
Autores: Liu, Zhenguo; Li, Zhao; Ao, Wengang; Zhang, Shaoshuang; Liu, Wenlong; He, Yizhi
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Red de coincidencia estéreo de fusión adaptativa y atención de costo multi-escala
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Convolución 2D
Volumen de costos
Emparejamiento estéreo
Módulo de atención
Eficiencia de fusión
Mapa de disparidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
En la actualidad, en comparación con la convolución 3D, la convolución 2D es menos costosa computacionalmente y más rápida en los métodos de emparejamiento estéreo basados en convolución. Sin embargo, en comparación con el volumen de coste inicial generado por cálculo utilizando un método de convolución 3D, el volumen de coste inicial generado por convolución 2D en la capa relevante carece de información rica, lo que resulta en que el área afectada por la iluminación en el mapa de disparidad tenga una menor robustez y afecte así su precisión. Por lo tanto, para abordar la falta de información rica en el volumen de coste en el método de convolución 2D, este artículo propone una red de emparejamiento estéreo de atención de coste adaptativa multi-escala y fusión adaptativa (MCAFNet) basada en AANet+. En primer lugar, las características extraídas se utilizan para el cálculo de coste inicial, y el volumen de coste se introduce en el módulo de atención de coste adaptativa multi-escala para generar peso de atención, que luego se combina con el volumen de coste inicial para suprimir la información irrelevante y enriquecer el volumen de coste. En segundo lugar, se mejora la parte de agregación de costes del modelo. Se añade un módulo de fusión adaptativa multi-escala para mejorar la eficiencia de fusión de la agregación de costes entre escalas. En el conjunto de datos de Scene Flow, el EPE se reduce a 0,66. Las tasas de error de emparejamiento en los conjuntos de datos KITTI2012 y KITTI2015 son del 1,60% y 2,22%, respectivamente.
Descripción
En la actualidad, en comparación con la convolución 3D, la convolución 2D es menos costosa computacionalmente y más rápida en los métodos de emparejamiento estéreo basados en convolución. Sin embargo, en comparación con el volumen de coste inicial generado por cálculo utilizando un método de convolución 3D, el volumen de coste inicial generado por convolución 2D en la capa relevante carece de información rica, lo que resulta en que el área afectada por la iluminación en el mapa de disparidad tenga una menor robustez y afecte así su precisión. Por lo tanto, para abordar la falta de información rica en el volumen de coste en el método de convolución 2D, este artículo propone una red de emparejamiento estéreo de atención de coste adaptativa multi-escala y fusión adaptativa (MCAFNet) basada en AANet+. En primer lugar, las características extraídas se utilizan para el cálculo de coste inicial, y el volumen de coste se introduce en el módulo de atención de coste adaptativa multi-escala para generar peso de atención, que luego se combina con el volumen de coste inicial para suprimir la información irrelevante y enriquecer el volumen de coste. En segundo lugar, se mejora la parte de agregación de costes del modelo. Se añade un módulo de fusión adaptativa multi-escala para mejorar la eficiencia de fusión de la agregación de costes entre escalas. En el conjunto de datos de Scene Flow, el EPE se reduce a 0,66. Las tasas de error de emparejamiento en los conjuntos de datos KITTI2012 y KITTI2015 son del 1,60% y 2,22%, respectivamente.