Siamese-rcnet: modelo de detección de defectos para superficies texturizadas complejas con pocas anotaciones
Autores: Guo, Dandan; Zhang, Chunying; Yang, Guanghui; Xue, Tao; Ma, Jiang; Liu, Lu; Ren, Jing
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Siamese-rcnet: modelo de detección de defectos para superficies texturizadas complejas con pocas anotaciones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Textura superficial
Defectos
Aprendizaje profundo
Siamese-RCNet
Precisión de detección
Extracción de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
La textura superficial de los objetos en escenas industriales es compleja y diversa, y las características de los defectos superficiales a menudo son muy similares al entorno y la textura de fondo, por lo que es difícil detectar con precisión el área defectuosa. Sin embargo, cuando se utiliza la tecnología de aprendizaje profundo para detectar defectos superficiales de textura compleja, la precisión de detección no es alta, debido a la falta de conjuntos de datos de etiquetas a nivel de píxel a gran escala. Por lo tanto, se propone un modelo de detección de defectos Siamese-RCNet para superficies de textura compleja con un pequeño número de anotaciones. La red de detección de objetivos Cascade R-CNN se utiliza como marco básico, aprovechando al máximo la información de características de imagen no etiquetada y fusionando la capacidad de aprendizaje de relaciones no lineales de la red Siamese y la capacidad de extracción de características de la red de base Res2Net para capturar de manera más efectiva las características sutiles de los defectos de textura superficial compleja. Se utiliza un método de medición de diferencia de imágenes para calcular la similitud entre diferentes imágenes y se construye un módulo de atención para ponderar el mapa de características de la pirámide de extracción de características, de modo que el modelo pueda enfocarse más en el área defectuosa y suprimir la influencia del área de textura de fondo compleja, para mejorar la precisión de la detección. Para verificar la efectividad del modelo Siamese-RCNet, se realizaron una serie de experimentos en el conjunto de datos DAGM2007 de defectos de textura de aprendizaje débilmente supervisado para inspección óptica industrial. Los resultados muestran que incluso si solo se utilizan el 20% de los conjuntos de datos etiquetados, el mAP@0.5 del modelo Siamese-RCNet aún puede alcanzar el 96,9%. En comparación con las redes tradicionales de detección de objetivos Cascade R-CNN y Faster R-CNN, el modelo Siamese-RCNet tiene una alta precisión, puede reducir la carga de trabajo del etiquetado manual y proporciona un fuerte apoyo para aplicaciones prácticas.
Descripción
La textura superficial de los objetos en escenas industriales es compleja y diversa, y las características de los defectos superficiales a menudo son muy similares al entorno y la textura de fondo, por lo que es difícil detectar con precisión el área defectuosa. Sin embargo, cuando se utiliza la tecnología de aprendizaje profundo para detectar defectos superficiales de textura compleja, la precisión de detección no es alta, debido a la falta de conjuntos de datos de etiquetas a nivel de píxel a gran escala. Por lo tanto, se propone un modelo de detección de defectos Siamese-RCNet para superficies de textura compleja con un pequeño número de anotaciones. La red de detección de objetivos Cascade R-CNN se utiliza como marco básico, aprovechando al máximo la información de características de imagen no etiquetada y fusionando la capacidad de aprendizaje de relaciones no lineales de la red Siamese y la capacidad de extracción de características de la red de base Res2Net para capturar de manera más efectiva las características sutiles de los defectos de textura superficial compleja. Se utiliza un método de medición de diferencia de imágenes para calcular la similitud entre diferentes imágenes y se construye un módulo de atención para ponderar el mapa de características de la pirámide de extracción de características, de modo que el modelo pueda enfocarse más en el área defectuosa y suprimir la influencia del área de textura de fondo compleja, para mejorar la precisión de la detección. Para verificar la efectividad del modelo Siamese-RCNet, se realizaron una serie de experimentos en el conjunto de datos DAGM2007 de defectos de textura de aprendizaje débilmente supervisado para inspección óptica industrial. Los resultados muestran que incluso si solo se utilizan el 20% de los conjuntos de datos etiquetados, el mAP@0.5 del modelo Siamese-RCNet aún puede alcanzar el 96,9%. En comparación con las redes tradicionales de detección de objetivos Cascade R-CNN y Faster R-CNN, el modelo Siamese-RCNet tiene una alta precisión, puede reducir la carga de trabajo del etiquetado manual y proporciona un fuerte apoyo para aplicaciones prácticas.