Soluciones de Segmentación de Líneas de Transmisión para Fotografía Aérea de UAV Basadas en UNet Mejorado
Autores: He, Min; Qin, Liang; Deng, Xinlan; Zhou, Sihan; Liu, Haofeng; Liu, Kaipei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Soluciones de Segmentación de Líneas de Transmisión para Fotografía Aérea de UAV Basadas en UNet Mejorado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Líneas de energía
Torres
Imágenes aéreas de drones
Modelo de segmentación de aprendizaje profundo
Algoritmo UNet
Extracción de características.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección precisa y eficiente de líneas eléctricas y torres en imágenes aéreas de drones con fondos complejos es crucial para la seguridad de las operaciones de la red eléctrica y los vuelos de drones a baja altitud. En este documento, proponemos un nuevo método que mejora el modelo de segmentación de aprendizaje profundo llamado algoritmo UNet, denominado TLSUNet. Mejoramos el algoritmo UNet utilizando una estructura de columna vertebral ligera para extraer las características y luego reconstruyéndolas con características de información contextual. En este modelo de red, para reducir sus parámetros y la complejidad computacional, adoptamos DFC-GhostNet (denominado Conexión Completa) como la red de extracción de características de columna vertebral, que está compuesta por la estructura DFC-GhostBottleneck y utiliza convolución asimétrica para capturar objetivos a larga distancia en las líneas de transmisión, mejorando así la capacidad de extracción del modelo. Además, diseñamos un módulo de extracción de características híbrido basado en convolución y un transformador para refinar características semánticas profundas y mejorar la capacidad del modelo para localizar torres y líneas de transmisión en entornos complejos. Finalmente, adoptamos el operador de aumento de muestreo CARAFE (Reensamblaje de Características Consciente del Contenido) para mejorar la precisión de la segmentación al mejorar la restauración de objetivos utilizando la correlación de información de píxeles del vecindario contextual bajo la decodificación de características. Nuestros experimentos en conjuntos de datos de fotografía aérea pública demuestran que el modelo mejorado requiere solo el 8.3% del esfuerzo computacional del modelo original y tiene solo el 21.4% de los parámetros del modelo original, mientras logra una reducción en el retraso de velocidad de inferencia de 0.012 s. Las métricas de segmentación también mostraron mejoras significativas, con el mIOU mejorando del 79.75% al 86.46% y el mDice mejorando del 87.83% al 92.40%. Estos resultados confirman la efectividad de nuestro método propuesto.
Descripción
La detección precisa y eficiente de líneas eléctricas y torres en imágenes aéreas de drones con fondos complejos es crucial para la seguridad de las operaciones de la red eléctrica y los vuelos de drones a baja altitud. En este documento, proponemos un nuevo método que mejora el modelo de segmentación de aprendizaje profundo llamado algoritmo UNet, denominado TLSUNet. Mejoramos el algoritmo UNet utilizando una estructura de columna vertebral ligera para extraer las características y luego reconstruyéndolas con características de información contextual. En este modelo de red, para reducir sus parámetros y la complejidad computacional, adoptamos DFC-GhostNet (denominado Conexión Completa) como la red de extracción de características de columna vertebral, que está compuesta por la estructura DFC-GhostBottleneck y utiliza convolución asimétrica para capturar objetivos a larga distancia en las líneas de transmisión, mejorando así la capacidad de extracción del modelo. Además, diseñamos un módulo de extracción de características híbrido basado en convolución y un transformador para refinar características semánticas profundas y mejorar la capacidad del modelo para localizar torres y líneas de transmisión en entornos complejos. Finalmente, adoptamos el operador de aumento de muestreo CARAFE (Reensamblaje de Características Consciente del Contenido) para mejorar la precisión de la segmentación al mejorar la restauración de objetivos utilizando la correlación de información de píxeles del vecindario contextual bajo la decodificación de características. Nuestros experimentos en conjuntos de datos de fotografía aérea pública demuestran que el modelo mejorado requiere solo el 8.3% del esfuerzo computacional del modelo original y tiene solo el 21.4% de los parámetros del modelo original, mientras logra una reducción en el retraso de velocidad de inferencia de 0.012 s. Las métricas de segmentación también mostraron mejoras significativas, con el mIOU mejorando del 79.75% al 86.46% y el mDice mejorando del 87.83% al 92.40%. Estos resultados confirman la efectividad de nuestro método propuesto.