Reconocimiento en tiempo real de piscinas fundidas basado en DeepLabV3+ mejorado en aplicaciones de soldadura TIG de orificio clave
Autores: Yang, Dayong; Dai, Penghui; Cui, Shuwan; Song, Huzhe; Liu, Feiyang; Zhou, Xuan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Reconocimiento en tiempo real de piscinas fundidas basado en DeepLabV3+ mejorado en aplicaciones de soldadura TIG de orificio clave
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Soldadura de gas inerte de tungsteno con orificio de llave
Proceso de soldadura
Imagen de piscina fundida
Aprendizaje profundo
Reconocimiento en tiempo real
Precisión de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Durante el proceso de soldadura por arco de tungsteno inerte con llave (K-TIG), se puede obtener una cantidad significativa de información relacionada con la calidad de la soldadura a partir de la piscina de soldadura y la llave de la imagen de la parte superior de la piscina fundida, lo que proporciona una base vital para el control de la calidad de la soldadura. Sin embargo, la imagen de la piscina fundida de la parte superior tiene la característica inestable de la fuerte luz del arco, lo que conduce a dificultades en la extracción del contorno. Los algoritmos de segmentación de imágenes existentes no pueden satisfacer los requisitos de precisión, tiempo y robustez. Con el objetivo de abordar estos problemas, en este documento se propuso un método de reconocimiento en tiempo real, basado en DeepLabV3+ mejorado, para identificar la piscina fundida de manera más precisa y efectiva. Primero, se seleccionó MobileNetV2 como la red de extracción de características para mejorar la eficiencia de detección. Luego, se optimizaron las tasas de dilatación de las capas de convolución dilatada para reducir el campo receptivo y equilibrar la sensibilidad del modelo a las piscinas fundidas de diferentes escalas. Finalmente, se introdujo el módulo de atención de bloques de convolución (CBAM) para mejorar la precisión de segmentación del modelo. Los resultados experimentales verificaron que el modelo propuesto tenía una velocidad de segmentación rápida y una mayor precisión de segmentación, con una ratio de intersección promedio del 89.89% y una velocidad de inferencia de 103 cuadros por segundo. Además, el modelo entrenado se implementó en un sistema en tiempo real y logró un rendimiento en tiempo real de hasta 28 cuadros por segundo, cumpliendo así con los requisitos de tiempo real y precisión del sistema de monitoreo de piscinas fundidas K-TIG.
Descripción
Durante el proceso de soldadura por arco de tungsteno inerte con llave (K-TIG), se puede obtener una cantidad significativa de información relacionada con la calidad de la soldadura a partir de la piscina de soldadura y la llave de la imagen de la parte superior de la piscina fundida, lo que proporciona una base vital para el control de la calidad de la soldadura. Sin embargo, la imagen de la piscina fundida de la parte superior tiene la característica inestable de la fuerte luz del arco, lo que conduce a dificultades en la extracción del contorno. Los algoritmos de segmentación de imágenes existentes no pueden satisfacer los requisitos de precisión, tiempo y robustez. Con el objetivo de abordar estos problemas, en este documento se propuso un método de reconocimiento en tiempo real, basado en DeepLabV3+ mejorado, para identificar la piscina fundida de manera más precisa y efectiva. Primero, se seleccionó MobileNetV2 como la red de extracción de características para mejorar la eficiencia de detección. Luego, se optimizaron las tasas de dilatación de las capas de convolución dilatada para reducir el campo receptivo y equilibrar la sensibilidad del modelo a las piscinas fundidas de diferentes escalas. Finalmente, se introdujo el módulo de atención de bloques de convolución (CBAM) para mejorar la precisión de segmentación del modelo. Los resultados experimentales verificaron que el modelo propuesto tenía una velocidad de segmentación rápida y una mayor precisión de segmentación, con una ratio de intersección promedio del 89.89% y una velocidad de inferencia de 103 cuadros por segundo. Además, el modelo entrenado se implementó en un sistema en tiempo real y logró un rendimiento en tiempo real de hasta 28 cuadros por segundo, cumpliendo así con los requisitos de tiempo real y precisión del sistema de monitoreo de piscinas fundidas K-TIG.