Un modelo mejorado de detección de cajas giratorias para la detección de litchi en huertos densos naturales
Autores: Li, Bin; Lu, Huazhong; Wei, Xinyu; Guan, Shixuan; Zhang, Zhenyu; Zhou, Xingxing; Luo, Yizhi
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un modelo mejorado de detección de cajas giratorias para la detección de litchi en huertos densos naturales
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Significativo
Identificación de litchi
Modelos de detección
Caja de detección de rotación
YOLOv8n
Tasa de precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La identificación precisa de litchi es de gran importancia para las estimaciones de rendimiento en huertos. El litchi en escenas naturales tiene grandes diferencias de escala y está oculto por hojas, lo que reduce la precisión de los modelos de detección de litchi. La adopción de cajas delimitadoras horizontales tradicionales introducirá una gran cantidad de fondo y superposición con fotogramas adyacentes, lo que resultará en una reducción de la precisión de detección de litchi. Por lo tanto, este estudio introduce de manera innovadora el uso del modelo de caja de detección de rotación para explorar sus capacidades en escenarios con oclusión y objetivos pequeños. Primero, se construye un conjunto de datos sobre la detección de rotación de litchi en escenas naturales. En segundo lugar, se proponen tres módulos de mejora basados en YOLOv8n: se introduce un módulo transformador después del módulo C2f de la octava capa de la red principal, se agrega un módulo de atención ECA a la red de cuello para mejorar la extracción de características de la red principal, y se introduce una cabeza de detección de escala 160 x 160 para mejorar la detección de objetivos pequeños. Los resultados de las pruebas muestran que, en comparación con el modelo YOLOv8n tradicional, el modelo propuesto mejora la tasa de precisión, la tasa de recuperación y el mAP en un 11.7%, 5.4% y 7.3%, respectivamente. Además, se estudian cuatro redes principales de detección de última generación, a saber, MobileNetv3-small, MobileNetv3-large, ShuffleNetv2 y GhostNet, para comparar el rendimiento del modelo propuesto. El modelo propuesto en este artículo exhibe un mejor rendimiento en el conjunto de datos de litchi, con la precisión, la recuperación y el mAP alcanzando el 84.6%, 68.6% y 79.4%, respectivamente. Esta investigación puede proporcionar una referencia para las estimaciones de rendimiento de litchi en entornos de huertos complejos.
Descripción
La identificación precisa de litchi es de gran importancia para las estimaciones de rendimiento en huertos. El litchi en escenas naturales tiene grandes diferencias de escala y está oculto por hojas, lo que reduce la precisión de los modelos de detección de litchi. La adopción de cajas delimitadoras horizontales tradicionales introducirá una gran cantidad de fondo y superposición con fotogramas adyacentes, lo que resultará en una reducción de la precisión de detección de litchi. Por lo tanto, este estudio introduce de manera innovadora el uso del modelo de caja de detección de rotación para explorar sus capacidades en escenarios con oclusión y objetivos pequeños. Primero, se construye un conjunto de datos sobre la detección de rotación de litchi en escenas naturales. En segundo lugar, se proponen tres módulos de mejora basados en YOLOv8n: se introduce un módulo transformador después del módulo C2f de la octava capa de la red principal, se agrega un módulo de atención ECA a la red de cuello para mejorar la extracción de características de la red principal, y se introduce una cabeza de detección de escala 160 x 160 para mejorar la detección de objetivos pequeños. Los resultados de las pruebas muestran que, en comparación con el modelo YOLOv8n tradicional, el modelo propuesto mejora la tasa de precisión, la tasa de recuperación y el mAP en un 11.7%, 5.4% y 7.3%, respectivamente. Además, se estudian cuatro redes principales de detección de última generación, a saber, MobileNetv3-small, MobileNetv3-large, ShuffleNetv2 y GhostNet, para comparar el rendimiento del modelo propuesto. El modelo propuesto en este artículo exhibe un mejor rendimiento en el conjunto de datos de litchi, con la precisión, la recuperación y el mAP alcanzando el 84.6%, 68.6% y 79.4%, respectivamente. Esta investigación puede proporcionar una referencia para las estimaciones de rendimiento de litchi en entornos de huertos complejos.