Swin Transformer combinado con red neuronal convolucional para la detección de defectos en superficies
Autores: Li, Yinghao; Xiang, Yihao; Guo, Haogong; Liu, Panpan; Liu, Chengming
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Swin Transformer combinado con red neuronal convolucional para la detección de defectos en superficies
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Detección de defectos en superficies
Transformador Swin
Redes neuronales convolucionales
Características de defectos
Pérdida focal
Fusión de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La detección de defectos en superficies tiene como objetivo clasificar y localizar un cierto defecto que existe en el área de superficie objetivo. Es una parte importante de la inspección de calidad industrial. La mayoría de la investigación sobre la detección de defectos en superficies se basa actualmente en redes neuronales convolucionales (CNN), que se preocupan más por la información local y carecen de percepción global. Por lo tanto, las CNN no pueden extraer eficazmente las características del defecto. En este documento, se propone un método de detección de defectos basado en el transformador Swin. La estructura del transformador Swin ha sido ajustada para que tenga cinco escalas de salida, lo que la hace más adecuada para tareas de detección de defectos con grandes variaciones en el tamaño del objetivo. Se utiliza una red de pirámide de características bidireccional como parte de la fusión de características para fusionar de manera eficiente las características extraídas. Se utiliza la pérdida focal como función de pérdida para ponderar las muestras difíciles y fáciles de distinguir, lo que potencialmente hace que el modelo se ajuste mejor a los datos de defectos en la superficie. Para reducir el número de parámetros en el modelo, se eligió una cabeza de detección compartida para la predicción de resultados. Se realizaron experimentos en el conjunto de datos de defectos en la superficie de bridas y en el conjunto de datos de defectos en la superficie de acero, respectivamente. En comparación con el algoritmo de detección de objetivos de CNN clásicas, nuestro método mejora la precisión media promedio (mAP) en aproximadamente un 15.4%, mientras que el volumen del modelo y la velocidad de detección son esencialmente los mismos que los del método basado en CNN. Los resultados experimentales muestran que nuestro método propuesto es más competitivo en comparación con los métodos basados en CNN y tiene cierta generalidad para diferentes tipos de defectos.
Descripción
La detección de defectos en superficies tiene como objetivo clasificar y localizar un cierto defecto que existe en el área de superficie objetivo. Es una parte importante de la inspección de calidad industrial. La mayoría de la investigación sobre la detección de defectos en superficies se basa actualmente en redes neuronales convolucionales (CNN), que se preocupan más por la información local y carecen de percepción global. Por lo tanto, las CNN no pueden extraer eficazmente las características del defecto. En este documento, se propone un método de detección de defectos basado en el transformador Swin. La estructura del transformador Swin ha sido ajustada para que tenga cinco escalas de salida, lo que la hace más adecuada para tareas de detección de defectos con grandes variaciones en el tamaño del objetivo. Se utiliza una red de pirámide de características bidireccional como parte de la fusión de características para fusionar de manera eficiente las características extraídas. Se utiliza la pérdida focal como función de pérdida para ponderar las muestras difíciles y fáciles de distinguir, lo que potencialmente hace que el modelo se ajuste mejor a los datos de defectos en la superficie. Para reducir el número de parámetros en el modelo, se eligió una cabeza de detección compartida para la predicción de resultados. Se realizaron experimentos en el conjunto de datos de defectos en la superficie de bridas y en el conjunto de datos de defectos en la superficie de acero, respectivamente. En comparación con el algoritmo de detección de objetivos de CNN clásicas, nuestro método mejora la precisión media promedio (mAP) en aproximadamente un 15.4%, mientras que el volumen del modelo y la velocidad de detección son esencialmente los mismos que los del método basado en CNN. Los resultados experimentales muestran que nuestro método propuesto es más competitivo en comparación con los métodos basados en CNN y tiene cierta generalidad para diferentes tipos de defectos.