Cd-mae: modelo de pre-entrenamiento de autoencoder de doble máscara contrastiva para la segmentación de elementos de imagen de TC de PCB
Autores: Song, Baojie; Chen, Jian; Shi, Shuhao; Yang, Jie; Chen, Chen; Qiao, Kai; Yan, Bin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Cd-mae: modelo de pre-entrenamiento de autoencoder de doble máscara contrastiva para la segmentación de elementos de imagen de TC de PCB
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección
Pruebas no destructivas
Tomografía computarizada
Segmentación semántica
Aprendizaje profundo
Pre-entrenamiento.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La detección de elementos es un paso importante en el proceso de prueba no destructiva de placas de circuito impreso (PCB) basado en tomografía computarizada (TC). Comparado con el método tradicional de detección manual, el método de segmentación semántica de imágenes basado en aprendizaje profundo mejora significativamente la eficiencia y precisión. Sin embargo, los modelos de segmentación semántica a menudo requieren una gran cantidad de datos para un entrenamiento supervisado que generalice un mejor rendimiento del modelo. A diferencia de las imágenes naturales, la tarea de anotación de imágenes de TC de PCB es más lenta y laboriosa que la tarea de segmentación semántica. Para reducir el costo de etiquetado y mejorar la capacidad del modelo para utilizar datos no etiquetados, el pre-entrenamiento no supervisado es una elección muy razonable y necesaria. El modelo de reconstrucción de imagen enmascarada representado por un autoencoder enmascarado se pre-entrena en los datos no etiquetados, aprendiendo una fuerte capacidad de representación de características al recuperar la imagen enmascarada, y muestra una buena capacidad de generalización en varias tareas posteriores. En la tarea de segmentación de elementos de imágenes de TC de PCB, considerando las características de la imagen, es necesario utilizar un modelo con una fuerte robustez de características en la etapa de pre-entrenamiento para realizar el aprendizaje de representación en una gran cantidad de imágenes de TC de PCB no etiquetadas. Basándonos en los objetivos anteriores, propusimos un modelo de pre-entrenamiento de autoencoder enmascarado dual contrastivo (CD-MAE), que puede aprender una representación de características más robusta en imágenes de TC de PCB no etiquetadas. Nuestros experimentos muestran que el CD-MAE supera al modelo base y a los modelos completamente supervisados en la tarea de segmentación de elementos de TC de PCB.
Descripción
La detección de elementos es un paso importante en el proceso de prueba no destructiva de placas de circuito impreso (PCB) basado en tomografía computarizada (TC). Comparado con el método tradicional de detección manual, el método de segmentación semántica de imágenes basado en aprendizaje profundo mejora significativamente la eficiencia y precisión. Sin embargo, los modelos de segmentación semántica a menudo requieren una gran cantidad de datos para un entrenamiento supervisado que generalice un mejor rendimiento del modelo. A diferencia de las imágenes naturales, la tarea de anotación de imágenes de TC de PCB es más lenta y laboriosa que la tarea de segmentación semántica. Para reducir el costo de etiquetado y mejorar la capacidad del modelo para utilizar datos no etiquetados, el pre-entrenamiento no supervisado es una elección muy razonable y necesaria. El modelo de reconstrucción de imagen enmascarada representado por un autoencoder enmascarado se pre-entrena en los datos no etiquetados, aprendiendo una fuerte capacidad de representación de características al recuperar la imagen enmascarada, y muestra una buena capacidad de generalización en varias tareas posteriores. En la tarea de segmentación de elementos de imágenes de TC de PCB, considerando las características de la imagen, es necesario utilizar un modelo con una fuerte robustez de características en la etapa de pre-entrenamiento para realizar el aprendizaje de representación en una gran cantidad de imágenes de TC de PCB no etiquetadas. Basándonos en los objetivos anteriores, propusimos un modelo de pre-entrenamiento de autoencoder enmascarado dual contrastivo (CD-MAE), que puede aprender una representación de características más robusta en imágenes de TC de PCB no etiquetadas. Nuestros experimentos muestran que el CD-MAE supera al modelo base y a los modelos completamente supervisados en la tarea de segmentación de elementos de TC de PCB.