Investigación sobre la Red de Detección de Objetos de Pirámide de Características Multi-Rango Bidireccional y Captura de Características Clave
Autores: Zhang, Heng; Shao, Faming; He, Xiaohui; Zhao, Dewei; Zhang, Zihan; Zhang, Tao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Investigación sobre la Red de Detección de Objetos de Pirámide de Características Multi-Rango Bidireccional y Captura de Características Clave
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Uav
Teledetección
Detección de objetos
Pirámide de características
Captura de características clave
Red
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos en imágenes de teledetección (RS) mediante UAV es una tecnología muy valiosa y desafiante. Este artículo discute la importancia de las características clave y propone una red de detección de objetos (URSNet) basada en una pirámide de características de múltiples tramos bidireccional y un mecanismo de captura de características clave. En primer lugar, se construye una pirámide de características de múltiples tramos bidireccional (BMSFPN). En el proceso de muestreo bidireccional, se utilizan la interpolación bicúbica y la fusión entre capas para filtrar el ruido de la imagen y mejorar los detalles de las características del objeto. En segundo lugar, el módulo de polarización de características diseñado (FPM) utiliza el mecanismo de atención de polarización interna para construir una representación de características poderosa para tareas de clasificación y regresión, facilitando que la red capture las características clave del objeto con una mayor discriminación semántica. Además, el módulo de alineación de rotación de anclaje (ARAM) refina aún más el marco de anclaje preestablecido basado en las características de regresión clave extraídas por el FPM para obtener anclajes de rotación de alta calidad con un alto grado de coincidencia y rica información visual de posicionamiento. Finalmente, se utiliza el módulo de optimización dinámica de anclajes (DAOM) para mejorar la capacidad de alineación de características y la discriminación de muestras positivas y negativas del modelo, de modo que el modelo pueda seleccionar dinámicamente el anclaje candidato para capturar las características de regresión clave y así eliminar aún más la desviación entre la clasificación y la regresión. URSNet ha realizado experimentos de ablación y comparativos SOTA exhaustivos en conjuntos de datos RS desafiantes como DOTA-V2.0, DIOR y RSOD. Los resultados experimentales óptimos (87.19% mAP, 108.2 FPS) muestran que URSNet tiene un rendimiento de detección eficiente y confiable.
Descripción
La detección de objetos en imágenes de teledetección (RS) mediante UAV es una tecnología muy valiosa y desafiante. Este artículo discute la importancia de las características clave y propone una red de detección de objetos (URSNet) basada en una pirámide de características de múltiples tramos bidireccional y un mecanismo de captura de características clave. En primer lugar, se construye una pirámide de características de múltiples tramos bidireccional (BMSFPN). En el proceso de muestreo bidireccional, se utilizan la interpolación bicúbica y la fusión entre capas para filtrar el ruido de la imagen y mejorar los detalles de las características del objeto. En segundo lugar, el módulo de polarización de características diseñado (FPM) utiliza el mecanismo de atención de polarización interna para construir una representación de características poderosa para tareas de clasificación y regresión, facilitando que la red capture las características clave del objeto con una mayor discriminación semántica. Además, el módulo de alineación de rotación de anclaje (ARAM) refina aún más el marco de anclaje preestablecido basado en las características de regresión clave extraídas por el FPM para obtener anclajes de rotación de alta calidad con un alto grado de coincidencia y rica información visual de posicionamiento. Finalmente, se utiliza el módulo de optimización dinámica de anclajes (DAOM) para mejorar la capacidad de alineación de características y la discriminación de muestras positivas y negativas del modelo, de modo que el modelo pueda seleccionar dinámicamente el anclaje candidato para capturar las características de regresión clave y así eliminar aún más la desviación entre la clasificación y la regresión. URSNet ha realizado experimentos de ablación y comparativos SOTA exhaustivos en conjuntos de datos RS desafiantes como DOTA-V2.0, DIOR y RSOD. Los resultados experimentales óptimos (87.19% mAP, 108.2 FPS) muestran que URSNet tiene un rendimiento de detección eficiente y confiable.