Algoritmo de segmentación semántica que fusiona imágenes de luz infrarroja y luz natural para la navegación automática en la inspección de líneas de transmisión
Autores: Yuan, Jie; Wang, Ting; Huo, Guanying; Jin, Ran; Wang, Lidong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Algoritmo de segmentación semántica que fusiona imágenes de luz infrarroja y luz natural para la navegación automática en la inspección de líneas de transmisión
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Vehículos aéreos no tripulados
Inspección de líneas de transmisión de energía
Segmentación semántica
Equipos de pylon de transmisión
Imágenes infrarrojas
Imágenes de luz natural
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Los vehículos aéreos no tripulados (UAVs) son ampliamente utilizados en la inspección de líneas de transmisión de energía hoy en día y necesitan navegar automáticamente reconociendo la categoría y posición precisa del equipo de pilar de transmisión en la inspección de líneas. La segmentación semántica es un método efectivo para reconocer el equipo de pilar de transmisión. En este documento, se propone un algoritmo de segmentación semántica que fusiona imágenes de luz infrarroja y natural. Se adopta un mecanismo de activación de interacción de atención multimodal para explotar completamente la complementación entre las imágenes de luz natural e infrarroja. Primero, se utiliza un bloque de información global con una estructura de pirámide de características para extraer y fusionar información contextual global a multi-escala de características fusionadas, y luego el bloque se utiliza para realizar la agregación de características en el procesamiento de decodificación, y se utiliza suficiente agregación con características a multi-escala de imágenes de luz natural e infrarroja para mejorar la capacidad de expresión del modelo y mejorar la precisión de la segmentación semántica del equipo de pilar de transmisión en escenas complejas. Nuestro método guía el proceso de aumento de muestreo y restauración de bajo nivel mediante características globales y de alto nivel más densas. Los resultados experimentales en un conjunto de datos de equipos de pilar de transmisión recopilados por nosotros muestran que el método propuesto logró mejores resultados de segmentación semántica que los métodos de vanguardia.
Descripción
Los vehículos aéreos no tripulados (UAVs) son ampliamente utilizados en la inspección de líneas de transmisión de energía hoy en día y necesitan navegar automáticamente reconociendo la categoría y posición precisa del equipo de pilar de transmisión en la inspección de líneas. La segmentación semántica es un método efectivo para reconocer el equipo de pilar de transmisión. En este documento, se propone un algoritmo de segmentación semántica que fusiona imágenes de luz infrarroja y natural. Se adopta un mecanismo de activación de interacción de atención multimodal para explotar completamente la complementación entre las imágenes de luz natural e infrarroja. Primero, se utiliza un bloque de información global con una estructura de pirámide de características para extraer y fusionar información contextual global a multi-escala de características fusionadas, y luego el bloque se utiliza para realizar la agregación de características en el procesamiento de decodificación, y se utiliza suficiente agregación con características a multi-escala de imágenes de luz natural e infrarroja para mejorar la capacidad de expresión del modelo y mejorar la precisión de la segmentación semántica del equipo de pilar de transmisión en escenas complejas. Nuestro método guía el proceso de aumento de muestreo y restauración de bajo nivel mediante características globales y de alto nivel más densas. Los resultados experimentales en un conjunto de datos de equipos de pilar de transmisión recopilados por nosotros muestran que el método propuesto logró mejores resultados de segmentación semántica que los métodos de vanguardia.