Dc-yolov8: algoritmo de detección de objetos de tamaño pequeño basado en sensor de cámara
Autores: Lou, Haitong; Duan, Xuehu; Guo, Junmei; Liu, Haiying; Gu, Jason; Bi, Lingyun; Chen, Haonan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Dc-yolov8: algoritmo de detección de objetos de tamaño pequeño basado en sensor de cámara
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tecnología de reconocimiento de objetos
Algoritmo de detección de objetos de tamaño pequeño
Método de submuestreo
Red de fusión de características
Estructura de red
Precisión de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 54
Citaciones: Sin citaciones
Los sensores de cámara tradicionales dependen de los ojos humanos para la observación. Sin embargo, los ojos humanos son propensos al cansancio al observar objetos de diferentes tamaños durante mucho tiempo en escenas complejas, y la cognición humana es limitada, lo que a menudo conduce a errores de juicio y reduce en gran medida la eficiencia. La tecnología de reconocimiento de objetos es una tecnología importante utilizada para juzgar la categoría del objeto en un sensor de cámara. Con el fin de resolver este problema, en este documento se propuso un algoritmo de detección de objetos de tamaño pequeño para escenarios especiales. La ventaja de este algoritmo es que no solo tiene una mayor precisión para la detección de objetos de tamaño pequeño, sino que también puede garantizar que la precisión de detección para cada tamaño no sea inferior a la del algoritmo existente. Hay tres innovaciones principales en este documento, que son las siguientes: (1) Se propone un nuevo método de submuestreo que podría preservar mejor la información del contexto de características. (2) Se mejora la red de fusión de características para combinar eficazmente información superficial e información profunda. (3) Se propone una nueva estructura de red para mejorar eficazmente la precisión de detección del modelo. Desde el punto de vista de la precisión de detección, es mejor que YOLOX, YOLOR, YOLOv3, YOLOv5 escalado, YOLOv7-Tiny y YOLOv8. Tres conjuntos de datos públicos autorizados se utilizan en estos experimentos: (a) En el conjunto de datos Visdron (objetos de tamaño pequeño), el mapa, la precisión y las tasas de recuperación de DC-YOLOv8 son un 2,5%, 1,9% y 2,1% más altas que las de YOLOv8s, respectivamente. (b) En el conjunto de datos Tinyperson (objetos de tamaño mínimo), el mapa, la precisión y las tasas de recuperación de DC-YOLOv8 son un 1%, 0,2% y 1,2% más altas que las de YOLOv8s, respectivamente. (c) En el conjunto de datos PASCAL VOC2007 (objetos de tamaño normal), el mapa, la precisión y las tasas de recuperación de DC-YOLOv8 son un 0,5%, 0,3% y 0,4% más altas que las de YOLOv8s, respectivamente.
Descripción
Los sensores de cámara tradicionales dependen de los ojos humanos para la observación. Sin embargo, los ojos humanos son propensos al cansancio al observar objetos de diferentes tamaños durante mucho tiempo en escenas complejas, y la cognición humana es limitada, lo que a menudo conduce a errores de juicio y reduce en gran medida la eficiencia. La tecnología de reconocimiento de objetos es una tecnología importante utilizada para juzgar la categoría del objeto en un sensor de cámara. Con el fin de resolver este problema, en este documento se propuso un algoritmo de detección de objetos de tamaño pequeño para escenarios especiales. La ventaja de este algoritmo es que no solo tiene una mayor precisión para la detección de objetos de tamaño pequeño, sino que también puede garantizar que la precisión de detección para cada tamaño no sea inferior a la del algoritmo existente. Hay tres innovaciones principales en este documento, que son las siguientes: (1) Se propone un nuevo método de submuestreo que podría preservar mejor la información del contexto de características. (2) Se mejora la red de fusión de características para combinar eficazmente información superficial e información profunda. (3) Se propone una nueva estructura de red para mejorar eficazmente la precisión de detección del modelo. Desde el punto de vista de la precisión de detección, es mejor que YOLOX, YOLOR, YOLOv3, YOLOv5 escalado, YOLOv7-Tiny y YOLOv8. Tres conjuntos de datos públicos autorizados se utilizan en estos experimentos: (a) En el conjunto de datos Visdron (objetos de tamaño pequeño), el mapa, la precisión y las tasas de recuperación de DC-YOLOv8 son un 2,5%, 1,9% y 2,1% más altas que las de YOLOv8s, respectivamente. (b) En el conjunto de datos Tinyperson (objetos de tamaño mínimo), el mapa, la precisión y las tasas de recuperación de DC-YOLOv8 son un 1%, 0,2% y 1,2% más altas que las de YOLOv8s, respectivamente. (c) En el conjunto de datos PASCAL VOC2007 (objetos de tamaño normal), el mapa, la precisión y las tasas de recuperación de DC-YOLOv8 son un 0,5%, 0,3% y 0,4% más altas que las de YOLOv8s, respectivamente.