Red de Conciencia de Forma Espacial para la Detección de Objetivos Alargados
Autores: Xu, Shaowen; Lee, Der-Horng
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Red de Conciencia de Forma Espacial para la Detección de Objetivos Alargados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Objetivos
Redes convolucionales
Información de forma
Extracción de características
Rendimiento de detección
Selección de muestra
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
En la detección de teledetección, los objetivos a menudo exhiben características únicas como formas alargadas, rotaciones multidireccionales y variaciones significativas de escala. Las redes convolucionales tradicionales extraen características utilizando núcleos de convolución y se basan en cajas de anclaje predefinidas y selección de muestras para enmarcar los objetivos. Sin embargo, este enfoque conlleva varios problemas, incluida la extracción imprecisa de características regionales, el descuido de la información de la forma del objeto y variaciones en el potencial de muestras positivas, todo derivado de variaciones de forma, lo que impacta en última instancia en el rendimiento del detector. Para superar estos desafíos, proponemos una red novedosa consciente de la forma espacial para la detección de objetivos alargados. Específicamente, presentamos tres módulos clave: un Módulo de Percepción de Características Espaciales Guiadas por el Borde (BGSF), un Módulo de Detección de Forma (SSM) y un Módulo de Evaluación de Potencial (PEM). El Módulo de Percepción de Características Espaciales Guiadas por el Borde ajusta las posiciones de muestreo y los pesos de los núcleos de convolución, alineando los mapas de características producidos por la red principal con la forma y ubicación real del objetivo, al tiempo que reduce las respuestas de características al ruido irrelevante. El Módulo de Detección de Forma incorpora información de forma en el proceso de selección de muestras, permitiendo que las cajas de anclaje de alto potencial, que pueden tener un bajo IoU pero capturar características críticas del objetivo, se retengan temporalmente para un entrenamiento adicional. El Módulo de Evaluación de Potencial integra la información de potencial de muestras positivas en la función de pérdida, proporcionando una retroalimentación de entrenamiento más sólida para muestras positivas de alto potencial. Los experimentos demuestran que, en comparación con las redes de detección existentes, nuestra estructura de red propuesta logra un rendimiento de detección superior en dos conjuntos de datos ampliamente utilizados, UCAS-AOD y HRSC2016.
Descripción
En la detección de teledetección, los objetivos a menudo exhiben características únicas como formas alargadas, rotaciones multidireccionales y variaciones significativas de escala. Las redes convolucionales tradicionales extraen características utilizando núcleos de convolución y se basan en cajas de anclaje predefinidas y selección de muestras para enmarcar los objetivos. Sin embargo, este enfoque conlleva varios problemas, incluida la extracción imprecisa de características regionales, el descuido de la información de la forma del objeto y variaciones en el potencial de muestras positivas, todo derivado de variaciones de forma, lo que impacta en última instancia en el rendimiento del detector. Para superar estos desafíos, proponemos una red novedosa consciente de la forma espacial para la detección de objetivos alargados. Específicamente, presentamos tres módulos clave: un Módulo de Percepción de Características Espaciales Guiadas por el Borde (BGSF), un Módulo de Detección de Forma (SSM) y un Módulo de Evaluación de Potencial (PEM). El Módulo de Percepción de Características Espaciales Guiadas por el Borde ajusta las posiciones de muestreo y los pesos de los núcleos de convolución, alineando los mapas de características producidos por la red principal con la forma y ubicación real del objetivo, al tiempo que reduce las respuestas de características al ruido irrelevante. El Módulo de Detección de Forma incorpora información de forma en el proceso de selección de muestras, permitiendo que las cajas de anclaje de alto potencial, que pueden tener un bajo IoU pero capturar características críticas del objetivo, se retengan temporalmente para un entrenamiento adicional. El Módulo de Evaluación de Potencial integra la información de potencial de muestras positivas en la función de pérdida, proporcionando una retroalimentación de entrenamiento más sólida para muestras positivas de alto potencial. Los experimentos demuestran que, en comparación con las redes de detección existentes, nuestra estructura de red propuesta logra un rendimiento de detección superior en dos conjuntos de datos ampliamente utilizados, UCAS-AOD y HRSC2016.