logo móvil
Contáctanos

Doublenet: un método para generar líneas de navegación de caminos de suelo no estructurados en un viñedo basado en CNN y Transformer

Autores: Cui, Xuezhi; Zhu, Licheng; Zhao, Bo; Wang, Ruixue; Han, Zhenhao; Lu, Kunlei; Feng, Xuguang; Ni, Jipeng; Cui, Xiaoyi

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Doublenet: un método para generar líneas de navegación de caminos de suelo no estructurados en un viñedo basado en CNN y Transformer


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Agronomía y Ciencia de los Cultivos

Palabras clave

Sistemas robóticos
Modelo de aprendizaje profundo
Características de imagen
Mecanismo de autoatención multi-cabeza
Función de activación
Bloque de operación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
Navegar por caminos no estructurados en viñedos con señales satelitales débiles presenta desafíos significativos para los sistemas robóticos. Esta investigación presenta DoubleNet, un innovador modelo de aprendizaje profundo diseñado para generar líneas de navegación para tales condiciones. Para mejorar la capacidad del modelo de extraer características de imagen, DoubleNet incorpora varias innovaciones clave, como un mecanismo de autoatención multi-cabeza único (Fused-MHSA), una función de activación modificada (SA-GELU) y un bloque de operación especializado (DNBLK). Basado en ellos, DoubleNet está estructurado como una red codificador-decodificador que incluye dos subredes paralelas: una dedicada al procesamiento de mapas de características 2D y la otra enfocada en tensores 1D. Estas subredes interactúan a través de dos redes de fusión de características, que operan en las etapas de codificación y decodificación, facilitando un proceso de extracción de características más integrado. Además, utilizamos un conjunto de datos especialmente anotado que comprende imágenes fusionadas con RGB y máscara, con cinco puntos de navegación marcados para mejorar la precisión de la localización de puntos. Como resultado de estas innovaciones, DoubleNet logra un notable 95.75% de porcentaje de puntos clave correctos (PCK) y opera a 71.16 FPS en nuestro conjunto de datos, con un rendimiento combinado que supera a varios algoritmos conocidos de detección de puntos clave. DoubleNet demuestra un fuerte potencial como solución competitiva para generar rutas de navegación efectivas para robots que operan en viñedos con caminos no estructurados.

Otros recursos que podrían interesarte

Temas Virtualpro