logo móvil
Contáctanos

Tcnet: red de convolución de transformadores para la detección de vanguardia de regiones de arroz no cosechado

Autores: Yang, Yukun; He, Jie; Wang, Pei; Luo, Xiwen; Zhao, Runmao; Huang, Peikui; Gao, Ruitao; Liu, Zhaodi; Luo, Yaling; Hu, Lian

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Tcnet: red de convolución de transformadores para la detección de vanguardia de regiones de arroz no cosechado


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Ciencias Agrícolas y Biológicas Generales

Palabras clave

Detección
De vanguardia
Transformador
CNN
Cosecha
Algoritmo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
La detección de vanguardia es un paso crítico en la cosecha mecanizada de arroz. A través de la detección visual de vanguardia, un algoritmo puede detectar en tiempo real si el proceso de cosecha de arroz está a lo largo de la vanguardia, reduciendo pérdidas y mejorando la eficiencia de la cosecha mecanizada. Aunque los modelos basados en redes neuronales convolucionales, que tienen una fuerte capacidad de adquisición de características locales, se han utilizado ampliamente en la producción de arroz, estos modelos solo involucran grandes campos receptivos en la red profunda. Además, un Transformador basado en autoatención puede proporcionar eficazmente características globales para complementar las desventajas de las CNN. Por lo tanto, para completar rápidamente y con precisión la tarea de detección de vanguardia en un entorno de cosecha de arroz complejo, este artículo desarrolla una Red de Convolución de Transformador (TCNet). Este algoritmo de detección de vanguardia combina el Transformador con una CNN. Específicamente, el Transformador realiza una incrustación de parches a través de una convolución de 3 x 3, y la salida se emplea como entrada del módulo del Transformador. Además, la atención multi-cabeza en el módulo del Transformador experimenta una reducción de dimensionalidad para disminuir la computación total de la red. En la red de avance, se utiliza una operación de convolución de 7 x 7 para realizar la codificación de posición de diferentes parches. Además, la CNN utiliza convoluciones separables en profundidad para extraer características locales de las imágenes. Las características globales extraídas por el Transformador y las características locales extraídas por la CNN se integran en el módulo de fusión. Los resultados de prueba demostraron que TCNet podría segmentar el 97.88% de la Intersección sobre Unión y el 98.95% de la Precisión en la región no cosechada, y el número de parámetros es solo de 10.796M. La detección de vanguardia es mejor que las redes de estructura ligera comunes, logrando el efecto de detección de redes convolucionales profundas (ResNet-50) con menos parámetros. El TCNet propuesto muestra las ventajas de un Transformador combinado con una CNN y proporciona información de referencia en tiempo real y confiable para la operación posterior de la cosecha de arroz.

Otros recursos que podrían interesarte

Temas Virtualpro