Detección de vehículos aéreos no tripulados de fusión multiescala basada en RT-DETR
Autores: Zhu, Minling; Kong, En
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de vehículos aéreos no tripulados de fusión multiescala basada en RT-DETR
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ciencia
Tecnología
UAV
Detección
Modelo
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Con el rápido desarrollo de la ciencia y la tecnología, la tecnología de vehículos aéreos no tripulados (UAV) ha mostrado una amplia gama de perspectivas de aplicación en diversos campos. La precisión y el rendimiento en tiempo real de la detección de objetivos de UAV juegan un papel vital en garantizar la seguridad y mejorar la eficiencia laboral de los UAV. Dirigido a los desafíos que enfrenta el campo actual de detección de UAV, este documento propone el modelo Gathering Cascaded Dilated DETR (GCD-DETR), que tiene como objetivo mejorar la precisión y eficiencia de la detección de objetivos de UAV. Las principales innovaciones de este documento son las siguientes: (1) El Bloque de Re-parametrización Dilatada se aplica de manera creativa al módulo residual de dilatación, que utiliza la convolución de núcleo grande y la convolución de núcleo pequeño en paralelo y fusiona los mapas de características generados por percepción multi-escala, mejorando en gran medida la capacidad de extracción de características, mejorando así la precisión de la detección de UAV. (2) Se introduce el mecanismo de Recolección y Distribución para mejorar efectivamente la capacidad de fusión de características multi-escala para que el modelo pueda aprovechar al máximo la información de características extraída de la red principal y mejorar aún más el rendimiento de detección. (3) Se introduce de manera innovadora el mecanismo de Atención de Grupo Cascada, que no solo ahorra costos computacionales, sino que también mejora la diversidad de atención al dividir la cabeza de atención de diferentes maneras, mejorando así la capacidad del modelo para procesar escenas complejas. Para verificar la efectividad del modelo propuesto, este documento realiza experimentos en múltiples conjuntos de datos de UAV de escenas complejas. Los resultados experimentales muestran que la precisión del modelo RT-DETR mejorado propuesto en este documento en los dos conjuntos de datos de UAV alcanza 0,956 y 0,978, respectivamente, lo que es un 2% y un 1,1% más alto que el del modelo RT-DETR original. Al mismo tiempo, los FPS del modelo también se mejoran en 10 cuadros por segundo, logrando un equilibrio efectivo entre precisión y velocidad.
Descripción
Con el rápido desarrollo de la ciencia y la tecnología, la tecnología de vehículos aéreos no tripulados (UAV) ha mostrado una amplia gama de perspectivas de aplicación en diversos campos. La precisión y el rendimiento en tiempo real de la detección de objetivos de UAV juegan un papel vital en garantizar la seguridad y mejorar la eficiencia laboral de los UAV. Dirigido a los desafíos que enfrenta el campo actual de detección de UAV, este documento propone el modelo Gathering Cascaded Dilated DETR (GCD-DETR), que tiene como objetivo mejorar la precisión y eficiencia de la detección de objetivos de UAV. Las principales innovaciones de este documento son las siguientes: (1) El Bloque de Re-parametrización Dilatada se aplica de manera creativa al módulo residual de dilatación, que utiliza la convolución de núcleo grande y la convolución de núcleo pequeño en paralelo y fusiona los mapas de características generados por percepción multi-escala, mejorando en gran medida la capacidad de extracción de características, mejorando así la precisión de la detección de UAV. (2) Se introduce el mecanismo de Recolección y Distribución para mejorar efectivamente la capacidad de fusión de características multi-escala para que el modelo pueda aprovechar al máximo la información de características extraída de la red principal y mejorar aún más el rendimiento de detección. (3) Se introduce de manera innovadora el mecanismo de Atención de Grupo Cascada, que no solo ahorra costos computacionales, sino que también mejora la diversidad de atención al dividir la cabeza de atención de diferentes maneras, mejorando así la capacidad del modelo para procesar escenas complejas. Para verificar la efectividad del modelo propuesto, este documento realiza experimentos en múltiples conjuntos de datos de UAV de escenas complejas. Los resultados experimentales muestran que la precisión del modelo RT-DETR mejorado propuesto en este documento en los dos conjuntos de datos de UAV alcanza 0,956 y 0,978, respectivamente, lo que es un 2% y un 1,1% más alto que el del modelo RT-DETR original. Al mismo tiempo, los FPS del modelo también se mejoran en 10 cuadros por segundo, logrando un equilibrio efectivo entre precisión y velocidad.