Estimación de profundidad de imagen de PCB monocular basada en red de convolución auto-supervisada
Autores: Huang, Zedong; Gu, Jinan; Li, Jing; Li, Shuwei; Hu, Junjie
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Estimación de profundidad de imagen de PCB monocular basada en red de convolución auto-supervisada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Estimación de profundidad de una sola imagen
Red neuronal convolucional
Módulo de atención
Datos de entrenamiento
Resultados experimentales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Para mejorar la precisión en el uso de redes neuronales profundas para predecir la información de profundidad de una sola imagen, propusimos una red neuronal convolucional no supervisada para la estimación de profundidad de una sola imagen. En primer lugar, la red se mejora al introducir un módulo residual denso en la estructura de codificación y decodificación. En segundo lugar, se introduce un módulo de atención híbrido optimizado en la red. Finalmente, se utiliza una imagen estéreo como datos de entrenamiento de la red para realizar la estimación de profundidad de una sola imagen de extremo a extremo. Los resultados experimentales en los conjuntos de datos KITTI y Cityscapes muestran que en comparación con algunos algoritmos clásicos, nuestro método propuesto puede obtener una mejor precisión y un menor error. Además, entrenamos nuestros modelos en conjuntos de datos de PCB en entornos industriales. Experimentos en varios escenarios verifican la capacidad de generalización del método propuesto y el excelente rendimiento del modelo.
Descripción
Para mejorar la precisión en el uso de redes neuronales profundas para predecir la información de profundidad de una sola imagen, propusimos una red neuronal convolucional no supervisada para la estimación de profundidad de una sola imagen. En primer lugar, la red se mejora al introducir un módulo residual denso en la estructura de codificación y decodificación. En segundo lugar, se introduce un módulo de atención híbrido optimizado en la red. Finalmente, se utiliza una imagen estéreo como datos de entrenamiento de la red para realizar la estimación de profundidad de una sola imagen de extremo a extremo. Los resultados experimentales en los conjuntos de datos KITTI y Cityscapes muestran que en comparación con algunos algoritmos clásicos, nuestro método propuesto puede obtener una mejor precisión y un menor error. Además, entrenamos nuestros modelos en conjuntos de datos de PCB en entornos industriales. Experimentos en varios escenarios verifican la capacidad de generalización del método propuesto y el excelente rendimiento del modelo.