Un algoritmo optimizado de detección de objetos para imágenes de teledetección marina
Autores: Ren, Yougui; Li, Jialu; Bao, Yubin; Zhao, Zhibin; Yu, Ge
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un algoritmo optimizado de detección de objetos para imágenes de teledetección marina
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Reto
Detección remota en alta mar
Super resolución
GANs
Modelo Faster R-CNN
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Para abordar el desafío de las escenas pequeñas, de pequeño objetivo y complejas que se encuentran a menudo en los conjuntos de datos de imágenes de detección remota en alta mar, este documento emplea un método de interpolación para lograr la detección de objetivos asistida por superresolución. Este enfoque se alinea con la lógica de las populares GAN y redes generativas de difusión en términos de superresolución pero es más ligero. Además, la cantidad de imágenes se expande cinco veces al complementar el conjunto de datos con DOTA y técnicas de aumento de datos. En cuanto al marco de trabajo, basado en el modelo Faster R-CNN, la combinación de una red de base residual y una estructura de equilibrio piramidal permite que nuestro modelo se adapte a las características de escenarios con pequeños objetivos. Además, el mecanismo de atención, la estrategia de reselección aleatoria de anclas y la estrategia de reemplazar operaciones de cuantización con interpolación bilineal mejoran aún más la capacidad de detección del modelo a bajo costo. Experimentos de ablación y experimentos comparativos muestran que, con una base simple, el algoritmo en este documento logra un mAP del 71.2% en el conjunto de datos, una mejora en la precisión de aproximadamente el 10% en comparación con el algoritmo Faster R-CNN.
Descripción
Para abordar el desafío de las escenas pequeñas, de pequeño objetivo y complejas que se encuentran a menudo en los conjuntos de datos de imágenes de detección remota en alta mar, este documento emplea un método de interpolación para lograr la detección de objetivos asistida por superresolución. Este enfoque se alinea con la lógica de las populares GAN y redes generativas de difusión en términos de superresolución pero es más ligero. Además, la cantidad de imágenes se expande cinco veces al complementar el conjunto de datos con DOTA y técnicas de aumento de datos. En cuanto al marco de trabajo, basado en el modelo Faster R-CNN, la combinación de una red de base residual y una estructura de equilibrio piramidal permite que nuestro modelo se adapte a las características de escenarios con pequeños objetivos. Además, el mecanismo de atención, la estrategia de reselección aleatoria de anclas y la estrategia de reemplazar operaciones de cuantización con interpolación bilineal mejoran aún más la capacidad de detección del modelo a bajo costo. Experimentos de ablación y experimentos comparativos muestran que, con una base simple, el algoritmo en este documento logra un mAP del 71.2% en el conjunto de datos, una mejora en la precisión de aproximadamente el 10% en comparación con el algoritmo Faster R-CNN.