logo móvil
Contáctanos

Dcfa-yolo: un red yolo de atención de fusión de características cruzadas de doble canal para la detección de racimos de tomates cherry

Autores: Chai, Shanglei; Wen, Ming; Li, Pengyu; Zeng, Zhi; Tian, Yibin

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Dcfa-yolo: un red yolo de atención de fusión de características cruzadas de doble canal para la detección de racimos de tomates cherry


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Ciencias Agrícolas y Biológicas Generales

Palabras clave

Propone
Red de detección de racimos de tomates cherry
Fusión de características cruzadas de doble canal
YOLOv8_n
Extracción de características multimodales
Mecanismo CBAM

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
Para aprovechar mejor la información multimodal para aplicaciones agrícolas, este artículo propone una red de detección de racimos de tomates cherry utilizando fusión de características cruzadas de doble canal. Su objetivo es mejorar el rendimiento de detección mediante el uso de la información complementaria de imágenes de color y profundidad. Utilizando el YOLOv8_n existente como el marco de referencia base, incorpora un mecanismo de atención de fusión cruzada de doble canal para la extracción y fusión de características multimodales. En la red de base, se adopta una unidad ShuffleNetV2 para optimizar la eficiencia de la extracción inicial de características. Durante la etapa de fusión de características, se introducen dos módulos mediante reparametrización, ponderación dinámica y concatenación eficiente para fortalecer la representación de la información multimodal. Mientras tanto, el mecanismo CBAM se integra en diferentes etapas de extracción de características, combinado con el módulo SPPF_CBAM mejorado, para mejorar efectivamente el enfoque y la representación de características críticas. Los resultados experimentales utilizando un conjunto de datos obtenido de un invernadero comercial demuestran que DCFA-YOLO sobresale en la detección de racimos de tomates cherry, logrando un mAP50 del 96.5%, una mejora significativa sobre el modelo base, al tiempo que reduce drásticamente la complejidad computacional. Además, las comparaciones con otros modelos YOLO de última generación y otros modelos de detección de objetos validan su rendimiento de detección. Esto proporciona una solución eficiente para la fusión multimodal para la detección de frutas en tiempo real en el contexto de la recolección robótica, funcionando a 52fps en una computadora normal.

Otros recursos que podrían interesarte

Temas Virtualpro