Método de detección de objetivos de pimienta verde Xiaomila en entorno complejo basado en YOLOv5s mejorado
Autores: Wang, Fenghua; Sun, Zhexing; Chen, Yu; Zheng, Hao; Jiang, Jin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Método de detección de objetivos de pimienta verde Xiaomila en entorno complejo basado en YOLOv5s mejorado
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Objetivos de frutas
Pimiento verde Xiaomila
Algoritmos de detección de redes de aprendizaje profundo
Modelo YOLOv5s-CFL
Precisión de detección
Estructura ligera
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La detección en tiempo real de objetivos de frutas es una tecnología clave del robot recolector de pimientos verdes Xiaomila (L.). Las condiciones complejas de los huertos dificultan lograr una detección precisa. Sin embargo, la mayoría de los algoritmos de detección de redes de aprendizaje profundo existentes no pueden detectar de manera efectiva las frutas de pimiento verde Xiaomila cubiertas por hojas, ramas y otras frutas en escenas naturales. Según se detalla en este documento, las imágenes Rojo, Verde, Azul (RGB) de pimientos verdes Xiaomila en etapa verde y madura se recopilaron bajo condiciones de luz natural para construir el conjunto de datos y se propone un modelo YOLOv5s mejorado (YOLOv5s-CFL) para mejorar la eficiencia y adaptabilidad de los robots recolectores en el entorno natural. Primero, la capa convolucional en la etapa parcial cruzada (CSP) se reemplaza con GhostConv, se mejora la velocidad de detección a través de una estructura liviana y se mejora la precisión de detección agregando una capa de Atención de Coordenadas (CA) y reemplazando la Red de Agregación de Rutas (PANet) en el cuello con la Red Piramidal de Características Bidireccionales (BiFPN). En el experimento, se utilizó el modelo YOLOv5s-CFL para detectar el Xiaomila, y los resultados de detección fueron analizados y comparados con los de los modelos originales YOLOv5s, YOLOv4-tiny y YOLOv3-tiny. Con estas mejoras, la Precisión Promedio de Media (mAP) de YOLOv5s-CFL es 1,1%, 6,8% y 8,9% más alta que la de YOLOv5s, YOLOv4-tiny y YOLOv3-tiny originales, respectivamente. En comparación con el modelo YOLOv5 original, el tamaño del modelo se reduce de 14,4 MB a 13,8 MB, y la velocidad de ejecución se reduce de 15,8 a 13,9 Gflops. Los resultados experimentales indican que el modelo liviano mejora la precisión de detección y tiene buenas perspectivas de rendimiento en tiempo real y aplicación en el campo de los robots recolectores.
Descripción
La detección en tiempo real de objetivos de frutas es una tecnología clave del robot recolector de pimientos verdes Xiaomila (L.). Las condiciones complejas de los huertos dificultan lograr una detección precisa. Sin embargo, la mayoría de los algoritmos de detección de redes de aprendizaje profundo existentes no pueden detectar de manera efectiva las frutas de pimiento verde Xiaomila cubiertas por hojas, ramas y otras frutas en escenas naturales. Según se detalla en este documento, las imágenes Rojo, Verde, Azul (RGB) de pimientos verdes Xiaomila en etapa verde y madura se recopilaron bajo condiciones de luz natural para construir el conjunto de datos y se propone un modelo YOLOv5s mejorado (YOLOv5s-CFL) para mejorar la eficiencia y adaptabilidad de los robots recolectores en el entorno natural. Primero, la capa convolucional en la etapa parcial cruzada (CSP) se reemplaza con GhostConv, se mejora la velocidad de detección a través de una estructura liviana y se mejora la precisión de detección agregando una capa de Atención de Coordenadas (CA) y reemplazando la Red de Agregación de Rutas (PANet) en el cuello con la Red Piramidal de Características Bidireccionales (BiFPN). En el experimento, se utilizó el modelo YOLOv5s-CFL para detectar el Xiaomila, y los resultados de detección fueron analizados y comparados con los de los modelos originales YOLOv5s, YOLOv4-tiny y YOLOv3-tiny. Con estas mejoras, la Precisión Promedio de Media (mAP) de YOLOv5s-CFL es 1,1%, 6,8% y 8,9% más alta que la de YOLOv5s, YOLOv4-tiny y YOLOv3-tiny originales, respectivamente. En comparación con el modelo YOLOv5 original, el tamaño del modelo se reduce de 14,4 MB a 13,8 MB, y la velocidad de ejecución se reduce de 15,8 a 13,9 Gflops. Los resultados experimentales indican que el modelo liviano mejora la precisión de detección y tiene buenas perspectivas de rendimiento en tiempo real y aplicación en el campo de los robots recolectores.