Detección rápida y precisa de objetivos pequeños y tenues para la vista inteligente de micro-luz
Autores: Wei, Jia; Che, Kai; Gong, Jiayuan; Zhou, Yun; Lv, Jian; Que, Longcheng; Liu, Hu; Len, Yuanbin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección rápida y precisa de objetivos pequeños y tenues para la vista inteligente de micro-luz
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Baja precisión de reconocimiento
Objetivos pequeños
Modelo ligero
Módulo de convolución de canal adaptativo
Aprendizaje multitarea
Mapa de características de alta resolución
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Para abordar la baja precisión de reconocimiento y el consumo de tiempo considerable para objetivos pequeños y tenues en una mira inteligente de micro luz, proponemos un modelo ligero DS_YOLO (detección de objetivos pequeños y tenues). Introducimos el módulo de convolución de canal adaptativo (ACConv) para reducir la redundancia computacional al tiempo que se maximiza la utilización de características del canal. Para abordar el problema de desalineación en el aprendizaje multitarea, también diseñamos un cabezal de detección de alineación de tarea dinámica ligero (LTD_Head), que utiliza GroupNorm para mejorar el rendimiento de la localización y clasificación del cabezal de detección, y comparte convoluciones para hacer que el modelo sea ligero. Además, para mejorar la capacidad de la red para detectar objetivos a pequeña escala al tiempo que mantiene su generalización a la detección de objetivos a múltiples escalas, extraemos información de mapas de características de alta resolución para establecer un nuevo cabezal de detección. En última instancia, la incorporación de la capa de agrupamiento piramidal de atención (SPPFLska) mejora la precisión de regresión del modelo. Realizamos una evaluación del algoritmo propuesto DS_YOLO en cuatro conjuntos de datos distintos: CityPersons, WiderPerson, DOTA y TinyPerson, logrando un mAP del 66.6% en el conjunto de datos CityPersons, un aumento del 4.3% respecto al modelo original. Mientras tanto, nuestro modelo reduce el recuento de parámetros en un 33.3% en comparación con el modelo base.
Descripción
Para abordar la baja precisión de reconocimiento y el consumo de tiempo considerable para objetivos pequeños y tenues en una mira inteligente de micro luz, proponemos un modelo ligero DS_YOLO (detección de objetivos pequeños y tenues). Introducimos el módulo de convolución de canal adaptativo (ACConv) para reducir la redundancia computacional al tiempo que se maximiza la utilización de características del canal. Para abordar el problema de desalineación en el aprendizaje multitarea, también diseñamos un cabezal de detección de alineación de tarea dinámica ligero (LTD_Head), que utiliza GroupNorm para mejorar el rendimiento de la localización y clasificación del cabezal de detección, y comparte convoluciones para hacer que el modelo sea ligero. Además, para mejorar la capacidad de la red para detectar objetivos a pequeña escala al tiempo que mantiene su generalización a la detección de objetivos a múltiples escalas, extraemos información de mapas de características de alta resolución para establecer un nuevo cabezal de detección. En última instancia, la incorporación de la capa de agrupamiento piramidal de atención (SPPFLska) mejora la precisión de regresión del modelo. Realizamos una evaluación del algoritmo propuesto DS_YOLO en cuatro conjuntos de datos distintos: CityPersons, WiderPerson, DOTA y TinyPerson, logrando un mAP del 66.6% en el conjunto de datos CityPersons, un aumento del 4.3% respecto al modelo original. Mientras tanto, nuestro modelo reduce el recuento de parámetros en un 33.3% en comparación con el modelo base.