Detección jerárquica de basada en YOLOX mejorado
Autores: Duan, Xingwei; Lin, Yuhao; Li, Lixia; Zhang, Fujie; Li, Shanshan; Liao, Yuxin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección jerárquica de basada en YOLOX mejorado
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Eficiencia del mercado
Aprendizaje profundo
Visión por computadora
Algoritmo de detección de objetos
Mecanismo de atención
Mejora del modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Identificar la calidad del en el mercado tiene baja eficiencia y precisión. Para abordar este problema, se propone en este artículo un algoritmo de detección de objetos I-YOLOX basado en aprendizaje profundo y visión por computadora. Primero, se recopilaron seis tipos de imágenes de diferentes calidades en la cooperativa de siembra para mejorar la imagen y etiquetarlas como conjunto de datos de entrenamiento del modelo. Segundo, para mejorar la extracción de información de características, se insertó un módulo de mecanismo de atención ECA entre la red principal CSPDarknet y la red de extracción de características de mejora del cuello FPN en el modelo YOLOX. Luego, se investigó el impacto del mecanismo de atención y la posición de aplicación en la mejora del modelo. Tercero, la convolución 3 x 3 en la red de extracción de características de mejora del cuello FPN y la red principal se reemplazó por convolución separable en profundidad (DS Conv) para reducir el tamaño del modelo y la cantidad de cálculos. Finalmente, se utilizó la función de pérdida EIoU para predecir la regresión del marco de límite en el extremo de predicción de salida para mejorar la velocidad de convergencia del modelo. Los resultados experimentales indicaron que en comparación con el modelo YOLOX original, la precisión media promedio del modelo de red I-YOLOX mejorado aumentó en un 4,86% (97,83%), el cálculo del modelo se redujo en 5,422 M (alcanzando 3,518 M), el tamaño del modelo se redujo en 20,6 MB (alcanzando 13,7 MB) y los cuadros de imagen detectados por segundo aumentaron en 3 (alcanzando 69). En comparación con otros algoritmos de detección de objetivos, el modelo mejorado superó a Faster R-CNN, SSD-VGG, YOLOv3s, YOLOv4s, YOLOv5s y YOLOv7 en términos de precisión media promedio, tamaño del modelo, cantidad de cálculos y cuadros por segundo. El modelo ligero mejoró la precisión de detección y la velocidad de diferentes calidades de y proporcionó una base teórica para el desarrollo de sistemas de identificación en línea de diferentes calidades de en la producción práctica.
Descripción
Identificar la calidad del en el mercado tiene baja eficiencia y precisión. Para abordar este problema, se propone en este artículo un algoritmo de detección de objetos I-YOLOX basado en aprendizaje profundo y visión por computadora. Primero, se recopilaron seis tipos de imágenes de diferentes calidades en la cooperativa de siembra para mejorar la imagen y etiquetarlas como conjunto de datos de entrenamiento del modelo. Segundo, para mejorar la extracción de información de características, se insertó un módulo de mecanismo de atención ECA entre la red principal CSPDarknet y la red de extracción de características de mejora del cuello FPN en el modelo YOLOX. Luego, se investigó el impacto del mecanismo de atención y la posición de aplicación en la mejora del modelo. Tercero, la convolución 3 x 3 en la red de extracción de características de mejora del cuello FPN y la red principal se reemplazó por convolución separable en profundidad (DS Conv) para reducir el tamaño del modelo y la cantidad de cálculos. Finalmente, se utilizó la función de pérdida EIoU para predecir la regresión del marco de límite en el extremo de predicción de salida para mejorar la velocidad de convergencia del modelo. Los resultados experimentales indicaron que en comparación con el modelo YOLOX original, la precisión media promedio del modelo de red I-YOLOX mejorado aumentó en un 4,86% (97,83%), el cálculo del modelo se redujo en 5,422 M (alcanzando 3,518 M), el tamaño del modelo se redujo en 20,6 MB (alcanzando 13,7 MB) y los cuadros de imagen detectados por segundo aumentaron en 3 (alcanzando 69). En comparación con otros algoritmos de detección de objetivos, el modelo mejorado superó a Faster R-CNN, SSD-VGG, YOLOv3s, YOLOv4s, YOLOv5s y YOLOv7 en términos de precisión media promedio, tamaño del modelo, cantidad de cálculos y cuadros por segundo. El modelo ligero mejoró la precisión de detección y la velocidad de diferentes calidades de y proporcionó una base teórica para el desarrollo de sistemas de identificación en línea de diferentes calidades de en la producción práctica.