logo móvil
Contáctanos

MCB-RT-DETR: Un Método de Detección de Embarcaciones en Tiempo Real para Operaciones Marítimas de UAV

Autores: Liu, Fang; Wei, Yongpeng; Yan, Aruhan; Cao, Tiezhu; Xie, Xinghai

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

MCB-RT-DETR: Un Método de Detección de Embarcaciones en Tiempo Real para Operaciones Marítimas de UAV


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Desafíos
Detección de barcos en tiempo real
MCB-RT-DETR
Atención de Canal Ortogonal
Pirámide de Mejora de Detalles de Objetos Pequeños
Eficiencia computacional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Las operaciones de UAV marítimos enfrentan desafíos en la detección de barcos en tiempo real. Los complejos fondos oceánicos, las drásticas variaciones de escala y la prevalencia de pequeños objetivos distantes crean dificultades. Proponemos MCB-RT-DETR, un transformador de detección en tiempo real mejorado por un refuerzo de múltiples componentes. Este método se basa en la arquitectura RT-DETR. Mejora significativamente la detección bajo interferencias de olas, cambios de iluminación y diferencias de escala. Las innovaciones clave abordan estos desafíos. Un mecanismo de Atención de Canal Ortogonal (Ortho) preserva los detalles de borde de alta frecuencia en la red de fondo. La Convolución de Atención de Campo Receptivo (RFAConv) mejora la robustez contra el desorden de fondo. Una Pirámide de Mejora de Detalles de Objetos Pequeños (SOD-EPN) refuerza la representación de pequeños objetivos. SOD-EPN combina SPDConv con transformaciones CSP-OmniKernel de múltiples escalas. La red de cuello integra un muestreo de DySample ultraligero. Esto permite un muestreo consciente del contenido para una localización precisa a múltiples escalas. El método mantiene una alta eficiencia computacional. Los experimentos en el conjunto de datos SeaDronesSee muestran mejoras significativas. MCB-RT-DETR logra un 82.9% de mAP@0.5 y un 49.7% de mAP@0.5:0.95. Estos corresponden a mejoras del 4.5% y 3.4% en relación con el modelo base. La velocidad de inferencia se mantiene en 50 FPS para el procesamiento en tiempo real. El rendimiento excepcional en pruebas cruzadas de conjuntos de datos valida aún más la fuerte capacidad de generalización del algoritmo en imágenes de teledetección DIOR y escenas aéreas VisDrone2019. El método proporciona una solución de percepción visual confiable para operaciones autónomas de UAV marítimos.

Otros recursos que podrían interesarte

Temas Virtualpro