Enfoque híbrido de múltiples granularidades para la recuperación de imágenes de pocas tomas con características débiles
Autores: Lu, Aiguo; Li, Zican; Liu, Yanwei; Liu, Pandi; Wang, Ke
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Enfoque híbrido de múltiples granularidades para la recuperación de imágenes de pocas tomas con características débiles
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Propone
Algoritmo de recuperación de múltiples granularidades
Red de aumento de imágenes no supervisada
Método de extracción de características
Módulo de convolución dinámica omni-dimensional
Mecanismo de atención de enrutamiento de dos niveles
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Este documento propone un algoritmo de recuperación de múltiples granularidades basado en una red de aumento de imágenes no supervisada. El algoritmo diseña un método de extracción de características (AugODNet_BRA) arraigado en el aumento de imágenes, que captura eficientemente características semánticas de alto nivel de imágenes con pocas muestras, objetivos pequeños y características débiles a través del aprendizaje no supervisado. El módulo de Convolución Dinámica Omnidimensional y el mecanismo de Atención de Enrutamiento de Doble Nivel se introducen para mejorar la adaptabilidad del modelo a escenas complejas y características variables, mejorando así su capacidad para capturar detalles de objetivos pequeños. El módulo de Convolución Dinámica Omnidimensional ajusta de manera flexible las dimensiones de los núcleos de convolución para acomodar objetivos pequeños de diferentes tamaños y formas. Al mismo tiempo, el mecanismo de Atención de Enrutamiento de Doble Nivel se enfoca de manera adaptativa en regiones clave, potenciando la capacidad discriminativa del modelo para objetivos en fondos complejos. La función de pérdida optimizada mejora aún más la robustez y distinción de las características, mejorando la precisión de recuperación. Los resultados experimentales demuestran que el método propuesto supera a los algoritmos de referencia en el conjunto de datos público CUB-200-2011 y muestra un gran potencial para su aplicación y valor práctico en escenarios como el reconocimiento del gancho de cola de aeronaves basadas en portaviones.
Descripción
Este documento propone un algoritmo de recuperación de múltiples granularidades basado en una red de aumento de imágenes no supervisada. El algoritmo diseña un método de extracción de características (AugODNet_BRA) arraigado en el aumento de imágenes, que captura eficientemente características semánticas de alto nivel de imágenes con pocas muestras, objetivos pequeños y características débiles a través del aprendizaje no supervisado. El módulo de Convolución Dinámica Omnidimensional y el mecanismo de Atención de Enrutamiento de Doble Nivel se introducen para mejorar la adaptabilidad del modelo a escenas complejas y características variables, mejorando así su capacidad para capturar detalles de objetivos pequeños. El módulo de Convolución Dinámica Omnidimensional ajusta de manera flexible las dimensiones de los núcleos de convolución para acomodar objetivos pequeños de diferentes tamaños y formas. Al mismo tiempo, el mecanismo de Atención de Enrutamiento de Doble Nivel se enfoca de manera adaptativa en regiones clave, potenciando la capacidad discriminativa del modelo para objetivos en fondos complejos. La función de pérdida optimizada mejora aún más la robustez y distinción de las características, mejorando la precisión de recuperación. Los resultados experimentales demuestran que el método propuesto supera a los algoritmos de referencia en el conjunto de datos público CUB-200-2011 y muestra un gran potencial para su aplicación y valor práctico en escenarios como el reconocimiento del gancho de cola de aeronaves basadas en portaviones.