logo móvil
Contáctanos

Investigación sobre la Red de Detección de Objetos de Pirámide de Características Multi-Rango Bidireccional y Captura de Características Clave

Autores: Zhang, Heng; Shao, Faming; He, Xiaohui; Zhao, Dewei; Zhang, Zihan; Zhang, Tao

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Investigación sobre la Red de Detección de Objetos de Pirámide de Características Multi-Rango Bidireccional y Captura de Características Clave


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Uav
Teledetección
Detección de objetos
Pirámide de características
Captura de características clave
Red

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La detección de objetos en imágenes de teledetección (RS) mediante UAV es una tecnología muy valiosa y desafiante. Este artículo discute la importancia de las características clave y propone una red de detección de objetos (URSNet) basada en una pirámide de características de múltiples tramos bidireccional y un mecanismo de captura de características clave. En primer lugar, se construye una pirámide de características de múltiples tramos bidireccional (BMSFPN). En el proceso de muestreo bidireccional, se utilizan la interpolación bicúbica y la fusión entre capas para filtrar el ruido de la imagen y mejorar los detalles de las características del objeto. En segundo lugar, el módulo de polarización de características diseñado (FPM) utiliza el mecanismo de atención de polarización interna para construir una representación de características poderosa para tareas de clasificación y regresión, facilitando que la red capture las características clave del objeto con una mayor discriminación semántica. Además, el módulo de alineación de rotación de anclaje (ARAM) refina aún más el marco de anclaje preestablecido basado en las características de regresión clave extraídas por el FPM para obtener anclajes de rotación de alta calidad con un alto grado de coincidencia y rica información visual de posicionamiento. Finalmente, se utiliza el módulo de optimización dinámica de anclajes (DAOM) para mejorar la capacidad de alineación de características y la discriminación de muestras positivas y negativas del modelo, de modo que el modelo pueda seleccionar dinámicamente el anclaje candidato para capturar las características de regresión clave y así eliminar aún más la desviación entre la clasificación y la regresión. URSNet ha realizado experimentos de ablación y comparativos SOTA exhaustivos en conjuntos de datos RS desafiantes como DOTA-V2.0, DIOR y RSOD. Los resultados experimentales óptimos (87.19% mAP, 108.2 FPS) muestran que URSNet tiene un rendimiento de detección eficiente y confiable.

Otros recursos que podrían interesarte

Temas Virtualpro