logo móvil
Contáctanos

Investigación sobre el método de detección y localización de objetos de Apple basado en YOLOX mejorado e imágenes RGB-D

Autores: Hu, Tiantian; Wang, Wenbo; Gu, Jinan; Xia, Zilin; Zhang, Jian; Wang, Bo

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Investigación sobre el método de detección y localización de objetos de Apple basado en YOLOX mejorado e imágenes RGB-D


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Agronomía y Ciencia de los Cultivos

Palabras clave

Sistema de reconocimiento de frutas basado en visión
Sistema de localización
Detección de objetos de manzana
Red YOLOX
Cámara RGB-D

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones


Descripción
El sistema de reconocimiento y localización de frutas basado en visión es la base para la operación automática de robots agrícolas de cosecha. Los modelos de detección existentes suelen estar limitados por una alta complejidad y una velocidad de inferencia lenta, lo que no cumple con los requisitos de tiempo real de los robots de cosecha. Aquí se propone un método para la detección y localización de objetos de manzana para abordar los problemas mencionados anteriormente. Primero, se diseña una red YOLOX mejorada para detectar la región objetivo, con una topología de múltiples ramas en la fase de entrenamiento y una estructura de una sola rama en la fase de inferencia. Se utiliza la capa de agrupamiento piramidal espacial (SPP) con estructura en serie para expandir el campo receptivo de la red base y garantizar una salida fija. En segundo lugar, se utiliza una cámara RGB-D para obtener la imagen de profundidad alineada y calcular el valor de profundidad del punto deseado. Finalmente, las coordenadas tridimensionales de los puntos de recogida de manzanas se obtienen combinando coordenadas bidimensionales en la imagen RGB y el valor de profundidad. Los resultados experimentales muestran que el método propuesto tiene una alta precisión y un rendimiento en tiempo real: F1 es del 93%, la precisión media promedio (mAP) es del 94.09%, la velocidad de detección puede alcanzar 167.43 F/s, y los errores de posicionamiento en las direcciones X, Y y Z son inferiores a 7 mm, 7 mm y 5 mm, respectivamente.

Otros recursos que podrían interesarte

Temas Virtualpro