Detección de manzanas precisa en tiempo real basada en YOLOv8n mejorado en entornos naturales complejos
Autores: Wang, Mingjie; Li, Fuzhong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Detección de manzanas precisa en tiempo real basada en YOLOv8n mejorado en entornos naturales complejos
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Manzana
Detección
Modelo
YOLOv8n
Ligero
Velocidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
La detección eficiente y precisa de manzanas es crucial para el funcionamiento de los robots de recolección de manzanas. Para mejorar la precisión y velocidad de detección, proponemos un modelo ligero de detección de manzanas basado en el marco YOLOv8n. El modelo propuesto introduce un novedoso módulo de atención de Coordenadas Auto-Calibradas (SCC), que mejora la extracción de características, especialmente para manzanas parcialmente ocultas, al capturar de manera efectiva la información espacial y de canal. Además, reemplazamos el módulo C2f dentro del cuello de YOLOv8n con un Módulo de Convolución Parcial mejorado con Reparametrización (PCMR), que acelera la detección, reduce los cálculos redundantes y minimiza tanto el conteo de parámetros como el acceso a la memoria durante la inferencia. Para optimizar aún más el modelo, fusionamos características de múltiples escalas de los segundos y terceros niveles de la pirámide de la arquitectura de fondo, logrando un diseño ligero adecuado para la detección en tiempo real. Para abordar las detecciones perdidas y las malas clasificaciones, se integra la Pérdida Polinómica (PolyLoss), mejorando la discriminación de clases para diferentes subcategorías de manzanas. En comparación con el YOLOv8n original, el modelo mejorado aumenta el mAP en un 2.90% hasta el 88.90% y mejora la velocidad de detección a 220 FPS, lo que es un 30.55% más rápido. Además, reduce el conteo de parámetros en un 89.36% y los FLOPs en un 2.47%. Los resultados experimentales demuestran que el modelo propuesto supera a los algoritmos de detección de objetos más utilizados, incluidos Faster R-CNN, RetinaNet, SSD, RT-DETR-R18, RT-DETR-R34, YOLOv5n, YOLOv6-N, YOLOv7-tiny, YOLOv8n, YOLOv9-T y YOLOv11n, tanto en mAP como en velocidad de detección. Notablemente, el modelo mejorado se ha utilizado para desarrollar una aplicación de Android desplegada en el teléfono inteligente iQOO Neo6 SE, logrando una velocidad de detección de 40 FPS, una mejora del 26.93% sobre el despliegue correspondiente de YOLOv8n, permitiendo la detección de manzanas en tiempo real. Este estudio proporciona una referencia valiosa para diseñar modelos de detección eficientes y ligeros para robots de recolección de manzanas con recursos limitados.
Descripción
La detección eficiente y precisa de manzanas es crucial para el funcionamiento de los robots de recolección de manzanas. Para mejorar la precisión y velocidad de detección, proponemos un modelo ligero de detección de manzanas basado en el marco YOLOv8n. El modelo propuesto introduce un novedoso módulo de atención de Coordenadas Auto-Calibradas (SCC), que mejora la extracción de características, especialmente para manzanas parcialmente ocultas, al capturar de manera efectiva la información espacial y de canal. Además, reemplazamos el módulo C2f dentro del cuello de YOLOv8n con un Módulo de Convolución Parcial mejorado con Reparametrización (PCMR), que acelera la detección, reduce los cálculos redundantes y minimiza tanto el conteo de parámetros como el acceso a la memoria durante la inferencia. Para optimizar aún más el modelo, fusionamos características de múltiples escalas de los segundos y terceros niveles de la pirámide de la arquitectura de fondo, logrando un diseño ligero adecuado para la detección en tiempo real. Para abordar las detecciones perdidas y las malas clasificaciones, se integra la Pérdida Polinómica (PolyLoss), mejorando la discriminación de clases para diferentes subcategorías de manzanas. En comparación con el YOLOv8n original, el modelo mejorado aumenta el mAP en un 2.90% hasta el 88.90% y mejora la velocidad de detección a 220 FPS, lo que es un 30.55% más rápido. Además, reduce el conteo de parámetros en un 89.36% y los FLOPs en un 2.47%. Los resultados experimentales demuestran que el modelo propuesto supera a los algoritmos de detección de objetos más utilizados, incluidos Faster R-CNN, RetinaNet, SSD, RT-DETR-R18, RT-DETR-R34, YOLOv5n, YOLOv6-N, YOLOv7-tiny, YOLOv8n, YOLOv9-T y YOLOv11n, tanto en mAP como en velocidad de detección. Notablemente, el modelo mejorado se ha utilizado para desarrollar una aplicación de Android desplegada en el teléfono inteligente iQOO Neo6 SE, logrando una velocidad de detección de 40 FPS, una mejora del 26.93% sobre el despliegue correspondiente de YOLOv8n, permitiendo la detección de manzanas en tiempo real. Este estudio proporciona una referencia valiosa para diseñar modelos de detección eficientes y ligeros para robots de recolección de manzanas con recursos limitados.