Doublenet: un método para generar líneas de navegación de caminos de suelo no estructurados en un viñedo basado en CNN y Transformer
Autores: Cui, Xuezhi; Zhu, Licheng; Zhao, Bo; Wang, Ruixue; Han, Zhenhao; Lu, Kunlei; Feng, Xuguang; Ni, Jipeng; Cui, Xiaoyi
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Doublenet: un método para generar líneas de navegación de caminos de suelo no estructurados en un viñedo basado en CNN y Transformer
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Sistemas robóticos
Modelo de aprendizaje profundo
Características de imagen
Mecanismo de autoatención multi-cabeza
Función de activación
Bloque de operación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Navegar por caminos no estructurados en viñedos con señales satelitales débiles presenta desafíos significativos para los sistemas robóticos. Esta investigación presenta DoubleNet, un innovador modelo de aprendizaje profundo diseñado para generar líneas de navegación para tales condiciones. Para mejorar la capacidad del modelo de extraer características de imagen, DoubleNet incorpora varias innovaciones clave, como un mecanismo de autoatención multi-cabeza único (Fused-MHSA), una función de activación modificada (SA-GELU) y un bloque de operación especializado (DNBLK). Basado en ellos, DoubleNet está estructurado como una red codificador-decodificador que incluye dos subredes paralelas: una dedicada al procesamiento de mapas de características 2D y la otra enfocada en tensores 1D. Estas subredes interactúan a través de dos redes de fusión de características, que operan en las etapas de codificación y decodificación, facilitando un proceso de extracción de características más integrado. Además, utilizamos un conjunto de datos especialmente anotado que comprende imágenes fusionadas con RGB y máscara, con cinco puntos de navegación marcados para mejorar la precisión de la localización de puntos. Como resultado de estas innovaciones, DoubleNet logra un notable 95.75% de porcentaje de puntos clave correctos (PCK) y opera a 71.16 FPS en nuestro conjunto de datos, con un rendimiento combinado que supera a varios algoritmos conocidos de detección de puntos clave. DoubleNet demuestra un fuerte potencial como solución competitiva para generar rutas de navegación efectivas para robots que operan en viñedos con caminos no estructurados.
Descripción
Navegar por caminos no estructurados en viñedos con señales satelitales débiles presenta desafíos significativos para los sistemas robóticos. Esta investigación presenta DoubleNet, un innovador modelo de aprendizaje profundo diseñado para generar líneas de navegación para tales condiciones. Para mejorar la capacidad del modelo de extraer características de imagen, DoubleNet incorpora varias innovaciones clave, como un mecanismo de autoatención multi-cabeza único (Fused-MHSA), una función de activación modificada (SA-GELU) y un bloque de operación especializado (DNBLK). Basado en ellos, DoubleNet está estructurado como una red codificador-decodificador que incluye dos subredes paralelas: una dedicada al procesamiento de mapas de características 2D y la otra enfocada en tensores 1D. Estas subredes interactúan a través de dos redes de fusión de características, que operan en las etapas de codificación y decodificación, facilitando un proceso de extracción de características más integrado. Además, utilizamos un conjunto de datos especialmente anotado que comprende imágenes fusionadas con RGB y máscara, con cinco puntos de navegación marcados para mejorar la precisión de la localización de puntos. Como resultado de estas innovaciones, DoubleNet logra un notable 95.75% de porcentaje de puntos clave correctos (PCK) y opera a 71.16 FPS en nuestro conjunto de datos, con un rendimiento combinado que supera a varios algoritmos conocidos de detección de puntos clave. DoubleNet demuestra un fuerte potencial como solución competitiva para generar rutas de navegación efectivas para robots que operan en viñedos con caminos no estructurados.