logo móvil
Contáctanos

MegaDetectNet: un marco de detección de objetos rápido para imágenes de ultra alta resolución

Autores: Wang, Jian; Zhang, Yuesong; Zhang, Fei; Li, Yazhou; Nie, Lingcong; Zhao, Jiale

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

MegaDetectNet: un marco de detección de objetos rápido para imágenes de ultra alta resolución


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Detectar objetos de manera eficiente
Imágenes de ultra alta resolución
MegaDetectNet
Red de extracción de primer plano
Detección de objetos
Imagen de primer plano

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones


Descripción
Abordando el desafío de detectar eficientemente objetos en imágenes de ultra alta resolución durante tareas de detección de objetos, este artículo propone un método novedoso llamado MegaDetectNet, que aprovecha la imagen de primer plano para la detección de objetos en imágenes de alta resolución a gran escala. MegaDetectNet utiliza una red de extracción de primer plano para generar una imagen de primer plano que resalta las regiones objetivo, evitando así el proceso intensivo computacional de dividir la imagen en múltiples subimágenes para la detección, y mejorando significativamente la eficiencia de la detección de objetos. La red de extracción de primer plano en MegaDetectNet se basa en el modelo YOLOv5 con modificaciones: se eliminan la cabeza de detección de objetos grandes y el clasificador, y se introduce la convolución PConv para reconstruir el módulo C3, acelerando así el proceso de convolución y mejorando la eficiencia de extracción de primer plano. Además, se desarrolla una estructura convolucional Res2Rep para ampliar el campo receptivo y mejorar la precisión de la extracción de primer plano. Finalmente, se propone un método de construcción de imagen de primer plano, fusionando y uniendo las regiones objetivo de primer plano en una imagen de primer plano unificada. Este enfoque reemplaza múltiples subimágenes divididas con una única imagen de primer plano para la detección, reduciendo el tiempo de sobrecarga. La efectividad del método MegaDetectNet propuesto para detectar objetos en imágenes de ultra alta resolución se valida utilizando el conjunto de datos DOTA disponible públicamente. Los resultados experimentales demuestran que MegaDetectNet logra una reducción de tiempo promedio del 83.8% en comparación con el método de división de subimágenes entre varios detectores de objetos comúnmente utilizados, con solo una disminución marginal del 8.7% en mAP (Precisión Media Promedio). Esto valida la practicidad y eficacia del método MegaDetectNet para la detección de objetos en imágenes de ultra alta resolución.

Otros recursos que podrían interesarte

Temas Virtualpro