Red de segmentación para hojas de brotes de té de múltiples formas basada en atención y agregación de características de ruta
Autores: Chen, Tianci; Li, Haoxin; Lv, Jinhong; Chen, Jiazheng; Wu, Weibin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Red de segmentación para hojas de brotes de té de múltiples formas basada en atención y agregación de características de ruta
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Hojas de brote de té
Precisión de segmentación
Bloque Transformer
Mecanismo de autoatención
Módulo de agregación de características
Modelo Unet-Enhanced
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
Detectar con precisión las hojas de brotes de té es crucial para la automatización de robots recolectores de té. Sin embargo, surgen desafíos debido a la oclusión del tallo del té y la superposición de brotes y hojas, lo que presenta formas variadas de objetivos de un brote-una hoja en el campo visual, lo que dificulta la segmentación precisa de las hojas de brotes de té. Para mejorar la precisión de segmentación de los objetivos de un brote-una hoja con diferentes formas y granularidad fina, este estudio propone un nuevo modelo de segmentación semántica para las hojas de brotes de té. El método diseña un bloque jerárquico de Transformer basado en un mecanismo de autoatención en la red de codificación, que es beneficioso para capturar dependencias a larga distancia entre características y mejorar la representación de características comunes. Luego, se diseña un módulo de agregación de características de múltiples caminos para fusionar de manera efectiva las salidas de características de los bloques de codificador con las salidas de decodificador, aliviando así la pérdida de características de granularidad fina causada por el muestreo descendente. Además, se emplea un mecanismo de atención polarizada refinado después del módulo de agregación para realizar un filtrado polarizado en características en dimensiones de canal y espaciales, mejorando la salida de características de granularidad fina. Los resultados experimentales demuestran que el modelo propuesto Unet-Enhanced logra un buen rendimiento de segmentación en objetivos de un brote-una hoja con diferentes formas, con una intersección media sobre unión (mIoU) del 91,18% y una precisión media de píxeles (mPA) del 95,10%. La red de segmentación semántica puede segmentar con precisión las hojas de brotes de té, proporcionando una base de toma de decisiones para el posicionamiento espacial de los robots recolectores de té.
Descripción
Detectar con precisión las hojas de brotes de té es crucial para la automatización de robots recolectores de té. Sin embargo, surgen desafíos debido a la oclusión del tallo del té y la superposición de brotes y hojas, lo que presenta formas variadas de objetivos de un brote-una hoja en el campo visual, lo que dificulta la segmentación precisa de las hojas de brotes de té. Para mejorar la precisión de segmentación de los objetivos de un brote-una hoja con diferentes formas y granularidad fina, este estudio propone un nuevo modelo de segmentación semántica para las hojas de brotes de té. El método diseña un bloque jerárquico de Transformer basado en un mecanismo de autoatención en la red de codificación, que es beneficioso para capturar dependencias a larga distancia entre características y mejorar la representación de características comunes. Luego, se diseña un módulo de agregación de características de múltiples caminos para fusionar de manera efectiva las salidas de características de los bloques de codificador con las salidas de decodificador, aliviando así la pérdida de características de granularidad fina causada por el muestreo descendente. Además, se emplea un mecanismo de atención polarizada refinado después del módulo de agregación para realizar un filtrado polarizado en características en dimensiones de canal y espaciales, mejorando la salida de características de granularidad fina. Los resultados experimentales demuestran que el modelo propuesto Unet-Enhanced logra un buen rendimiento de segmentación en objetivos de un brote-una hoja con diferentes formas, con una intersección media sobre unión (mIoU) del 91,18% y una precisión media de píxeles (mPA) del 95,10%. La red de segmentación semántica puede segmentar con precisión las hojas de brotes de té, proporcionando una base de toma de decisiones para el posicionamiento espacial de los robots recolectores de té.