Transformador optimizado de espacio de máscara para segmentación semántica de imágenes de defectos en la superficie de baterías de litio
Autores: Sun, Daozong; Chen, Jiasi; Wu, Peiwen; Pan, Yucheng; Zhong, Hongsheng; Deng, Zihao; Xue, Xiuyun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Transformador optimizado de espacio de máscara para segmentación semántica de imágenes de defectos en la superficie de baterías de litio
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Segmentación de baterías de litio
Desequilibrio primer plano-fondo
Defectos en la superficie
Optimización del Espacio de Máscara Transformadora
Segmentación semántica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
La segmentación de defectos superficiales en baterías de litio es crucial para mejorar la calidad general del proceso de producción. Sin embargo, el desequilibrio severo entre primer plano y fondo en las imágenes superficiales de las baterías de litio, junto con las formas irregulares y la distribución aleatoria de las regiones en primer plano, plantea desafíos significativos para la segmentación de defectos. Basándose en estas observaciones, este artículo se centra en la separación de primer plano y fondo en imágenes de defectos superficiales de baterías de litio y propone un nuevo Transformador de Optimización de Espacio de Máscara (MSOFormer) para la segmentación semántica de estas imágenes. Específicamente, el módulo de Pérdida de Límite de Máscara (MBL) en nuestro modelo proporciona una supervisión más eficiente durante el entrenamiento para mejorar la precisión del cálculo de la máscara dentro del mecanismo de atención de máscara, mejorando así el rendimiento del modelo en la separación de primer plano y fondo. Además, el módulo de Consulta Espacial Dinámica (DSQ) asigna información espacial de la imagen a cada consulta, mejorando la sensibilidad del modelo a las posiciones de los pequeños objetivos en primer plano en diversas escenas. El Decodificador de Píxeles Eficiente (EPD) asegura campos receptivos deformables para primeros planos con formas irregulares, al tiempo que mejora aún más el rendimiento y la eficiencia del modelo. Los resultados experimentales demuestran que nuestro método supera a otros métodos de vanguardia en términos de la Intersección sobre la Unión media (mIoU). Específicamente, nuestro enfoque logra un mIoU del 84,18% en el conjunto de pruebas de defectos superficiales de baterías de litio y mIoUs del 85,53% y 87,05% en dos conjuntos de prueba de defectos públicamente disponibles con características de defectos similares a las baterías de litio.
Descripción
La segmentación de defectos superficiales en baterías de litio es crucial para mejorar la calidad general del proceso de producción. Sin embargo, el desequilibrio severo entre primer plano y fondo en las imágenes superficiales de las baterías de litio, junto con las formas irregulares y la distribución aleatoria de las regiones en primer plano, plantea desafíos significativos para la segmentación de defectos. Basándose en estas observaciones, este artículo se centra en la separación de primer plano y fondo en imágenes de defectos superficiales de baterías de litio y propone un nuevo Transformador de Optimización de Espacio de Máscara (MSOFormer) para la segmentación semántica de estas imágenes. Específicamente, el módulo de Pérdida de Límite de Máscara (MBL) en nuestro modelo proporciona una supervisión más eficiente durante el entrenamiento para mejorar la precisión del cálculo de la máscara dentro del mecanismo de atención de máscara, mejorando así el rendimiento del modelo en la separación de primer plano y fondo. Además, el módulo de Consulta Espacial Dinámica (DSQ) asigna información espacial de la imagen a cada consulta, mejorando la sensibilidad del modelo a las posiciones de los pequeños objetivos en primer plano en diversas escenas. El Decodificador de Píxeles Eficiente (EPD) asegura campos receptivos deformables para primeros planos con formas irregulares, al tiempo que mejora aún más el rendimiento y la eficiencia del modelo. Los resultados experimentales demuestran que nuestro método supera a otros métodos de vanguardia en términos de la Intersección sobre la Unión media (mIoU). Específicamente, nuestro enfoque logra un mIoU del 84,18% en el conjunto de pruebas de defectos superficiales de baterías de litio y mIoUs del 85,53% y 87,05% en dos conjuntos de prueba de defectos públicamente disponibles con características de defectos similares a las baterías de litio.