logo móvil
Contáctanos

Rgb-d fusión de características de imagen heterogéneas para el modelo de detección de manzanas yolo

Autores: Liu, Liqun; Hao, Pengfei

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Rgb-d fusión de características de imagen heterogéneas para el modelo de detección de manzanas yolo


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Agronomía y Ciencia de los Cultivos

Palabras clave

Características de imagen heterogéneas
Fusión de características
Modelo YOLOfuse
RGB-D
Módulo de atención de coordenadas
Algoritmo Soft-NMS

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
Las características de imagen heterogéneas son complementarias, y la fusión de características de imágenes heterogéneas puede aumentar la efectividad de la posición de los objetivos de manzana ocultos. Se propone un modelo de detección de manzanas YOLOfuse basado en la fusión de características de imagen heterogénea RGB-D. Combinando la red CSPDarknet53-Tiny sobre la base de una red de espalda YOLOv5s, se forma una red de extracción de características de dos ramas para la tarea de extracción de imágenes heterogéneas RGB-D. Las dos ramas de la red de espalda se fusionan para maximizar la retención de características útiles y reducir el esfuerzo computacional. Un módulo de atención de coordenadas (CA) se incorpora en la red de espalda. Se introduce el algoritmo Soft-NMS, en lugar del algoritmo NMS general, para reducir el fenómeno de supresión falsa del algoritmo en objetos densos y reducir la tasa de posición perdida de las manzanas ocultas. Indica que el modelo YOLOfuse tiene un valor de AP del 94.2% y una velocidad de cuadro de detección de 51.761 FPS. Comparando con las versiones YOLOv5 s, m, l y x4, así como YOLOv3, YOLOv4, YOLOv4-Tiny y Faster RCNN en el conjunto de pruebas, los resultados muestran que el valor de AP del modelo propuesto es 0.8, 2.4, 2.5, 2.3 y 2.2 puntos porcentuales más alto que el de YOLOv5s, YOLOv3, YOLOv4, YOLOv4-Tiny y Faster RCNN, respectivamente. En comparación con YOLOv5m, YOLOv5l y YOLOv5x, se obtienen aceleraciones de 9.934FPS, 18.45FPS y 23.159FPS en la velocidad de cuadro de detección, respectivamente, y el modelo es mejor tanto en el número de parámetros como en el tamaño del modelo. El modelo YOLOfuse puede fusionar eficazmente características de imagen de origen heterogéneo RGB-D para identificar eficientemente objetos de manzana en un entorno de huerto natural y proporcionar soporte técnico para el sistema de visión de robots recolectores.

Otros recursos que podrían interesarte

Temas Virtualpro