Transmf: modelo de fusión multi-escala basado en transformadores para la detección de grietas
Autores: Ju, Xiaochen; Zhao, Xinxin; Qian, Shengsheng
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Transmf: modelo de fusión multi-escala basado en transformadores para la detección de grietas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Grietas
Inteligencia artificial
Detección
Desafíos
TransMF
Conjunto de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Las grietas son comunes en la infraestructura y están estrechamente relacionadas con la actividad humana. Es muy popular utilizar la inteligencia artificial para detectar grietas de manera inteligente, lo que se conoce como detección de grietas. El ruido en el fondo de las imágenes de grietas, la discontinuidad de las grietas y otros problemas hacen que la tarea de detección de grietas sea un gran desafío. Aunque se han propuesto muchos enfoques, todavía existen dos desafíos: (1) las grietas son largas y complejas en forma, lo que dificulta capturar la continuidad a larga distancia; (2) la mayoría de las imágenes en el conjunto de datos de grietas tienen ruido, y es difícil detectar solo las grietas e ignorar el ruido. En este documento, proponemos un método novedoso llamado (TransMF) para la detección de grietas, que incluye un Módulo Codificador (EM), Módulo Decodificador (DM) y Módulo de Fusión (FM). El Módulo Codificador utiliza una combinación de bloques de convolución y bloques de Transformador Swin para modelar las dependencias a larga distancia de diferentes partes en una imagen de grieta desde una perspectiva local y global. El Módulo Decodificador está diseñado con una estructura simétrica al Módulo Codificador. En el Módulo de Fusión, la salida en cada capa con escalas únicas del Módulo Codificador y del Módulo Decodificador se fusionan en forma de convolución, lo que puede liberar el efecto del ruido de fondo y fortalecer las correlaciones entre el contexto relevante para mejorar la detección de grietas. Finalmente, la salida de cada capa del Módulo de Fusión se concatena para lograr el propósito de la detección de grietas. Experimentos extensos en tres conjuntos de datos de referencia (CrackLS315, CRKWH100 y DeepCrack) demuestran que el TransMF propuesto en este documento supera el mejor rendimiento de los baselines actuales.
Descripción
Las grietas son comunes en la infraestructura y están estrechamente relacionadas con la actividad humana. Es muy popular utilizar la inteligencia artificial para detectar grietas de manera inteligente, lo que se conoce como detección de grietas. El ruido en el fondo de las imágenes de grietas, la discontinuidad de las grietas y otros problemas hacen que la tarea de detección de grietas sea un gran desafío. Aunque se han propuesto muchos enfoques, todavía existen dos desafíos: (1) las grietas son largas y complejas en forma, lo que dificulta capturar la continuidad a larga distancia; (2) la mayoría de las imágenes en el conjunto de datos de grietas tienen ruido, y es difícil detectar solo las grietas e ignorar el ruido. En este documento, proponemos un método novedoso llamado (TransMF) para la detección de grietas, que incluye un Módulo Codificador (EM), Módulo Decodificador (DM) y Módulo de Fusión (FM). El Módulo Codificador utiliza una combinación de bloques de convolución y bloques de Transformador Swin para modelar las dependencias a larga distancia de diferentes partes en una imagen de grieta desde una perspectiva local y global. El Módulo Decodificador está diseñado con una estructura simétrica al Módulo Codificador. En el Módulo de Fusión, la salida en cada capa con escalas únicas del Módulo Codificador y del Módulo Decodificador se fusionan en forma de convolución, lo que puede liberar el efecto del ruido de fondo y fortalecer las correlaciones entre el contexto relevante para mejorar la detección de grietas. Finalmente, la salida de cada capa del Módulo de Fusión se concatena para lograr el propósito de la detección de grietas. Experimentos extensos en tres conjuntos de datos de referencia (CrackLS315, CRKWH100 y DeepCrack) demuestran que el TransMF propuesto en este documento supera el mejor rendimiento de los baselines actuales.