Investigación sobre método mejorado de reconocimiento de navegación visual en carreteras basado en DeepLabV3+ en un huerto de pitaya
Autores: Zhu, Lixue; Deng, Wenqian; Lai, Yingjie; Guo, Xiaogeng; Zhang, Shiang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Investigación sobre método mejorado de reconocimiento de navegación visual en carreteras basado en DeepLabV3+ en un huerto de pitaya
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Tradicional
Deeplabv3+
Huerto de pitayas
Navegación visual
Extracción de características
Precisión de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 51
Citaciones: Sin citaciones
Los métodos tradicionales de segmentación semántica de imágenes DeepLabV3+ enfrentan desafíos en entornos de huertos de pitaya caracterizados por múltiples factores de interferencia, fondos de imagen complejos, alta complejidad computacional y un consumo de memoria extenso. Este documento presenta un método mejorado de reconocimiento de ruta de navegación visual para huertos de pitaya. Inicialmente, DeepLabV3+ utiliza un MobileNetV2 ligero como su espina dorsal principal de extracción de características, que se ve reforzado con un módulo de Atención Dividida en Pirámide (PSA) colocado después del módulo de Pooling de Pirámide Espacial Atrous (ASPP). Esta mejora potencia la representación de características espaciales de los mapas de características, afilando así los límites de segmentación. Además, se integra un mecanismo de Red de Atención de Canales Eficiente (ECANet) con las características de nivel inferior de MobileNetV2 para reducir la complejidad computacional y refinar la claridad de los límites de destino. El documento también diseña un algoritmo de extracción de ruta de navegación, que ajusta las regiones de máscara de carretera segmentadas por el modelo para lograr un reconocimiento preciso de la ruta de navegación. Los hallazgos experimentales muestran que el modelo mejorado de DeepLabV3+ logró un Índice Medio de Intersección sobre Unión (MIoU) y una precisión promedio de píxeles del 95.79% y 97.81%, respectivamente. Estas cifras representan aumentos de 0.59 y 0.41 puntos porcentuales en comparación con el modelo original. Además, el consumo de memoria del modelo se reduce en un 85.64%, 84.70% y 85.06% en comparación con los modelos de Pyramid Scene Parsing Network (PSPNet), U-Net y Fully Convolutional Network (FCN), respectivamente. Esta reducción hace que el modelo propuesto sea más eficiente manteniendo una alta precisión de segmentación, apoyando así una eficiencia operativa mejorada en aplicaciones prácticas. Los resultados de prueba para la precisión del reconocimiento de la ruta de navegación revelan que el error de ángulo entre la línea central de navegación extraída utilizando el método de mínimos cuadrados y la línea central ajustada manualmente es inferior a 5 grados. Además, la desviación promedio entre las líneas centrales de carretera extraídas bajo tres condiciones de iluminación diferentes y la línea central de carretera real es solo de 2.66 píxeles, con un tiempo promedio de reconocimiento de imagen de 0.10 s. Este rendimiento sugiere que el estudio puede proporcionar una referencia efectiva para la navegación visual en la agricultura inteligente.
Descripción
Los métodos tradicionales de segmentación semántica de imágenes DeepLabV3+ enfrentan desafíos en entornos de huertos de pitaya caracterizados por múltiples factores de interferencia, fondos de imagen complejos, alta complejidad computacional y un consumo de memoria extenso. Este documento presenta un método mejorado de reconocimiento de ruta de navegación visual para huertos de pitaya. Inicialmente, DeepLabV3+ utiliza un MobileNetV2 ligero como su espina dorsal principal de extracción de características, que se ve reforzado con un módulo de Atención Dividida en Pirámide (PSA) colocado después del módulo de Pooling de Pirámide Espacial Atrous (ASPP). Esta mejora potencia la representación de características espaciales de los mapas de características, afilando así los límites de segmentación. Además, se integra un mecanismo de Red de Atención de Canales Eficiente (ECANet) con las características de nivel inferior de MobileNetV2 para reducir la complejidad computacional y refinar la claridad de los límites de destino. El documento también diseña un algoritmo de extracción de ruta de navegación, que ajusta las regiones de máscara de carretera segmentadas por el modelo para lograr un reconocimiento preciso de la ruta de navegación. Los hallazgos experimentales muestran que el modelo mejorado de DeepLabV3+ logró un Índice Medio de Intersección sobre Unión (MIoU) y una precisión promedio de píxeles del 95.79% y 97.81%, respectivamente. Estas cifras representan aumentos de 0.59 y 0.41 puntos porcentuales en comparación con el modelo original. Además, el consumo de memoria del modelo se reduce en un 85.64%, 84.70% y 85.06% en comparación con los modelos de Pyramid Scene Parsing Network (PSPNet), U-Net y Fully Convolutional Network (FCN), respectivamente. Esta reducción hace que el modelo propuesto sea más eficiente manteniendo una alta precisión de segmentación, apoyando así una eficiencia operativa mejorada en aplicaciones prácticas. Los resultados de prueba para la precisión del reconocimiento de la ruta de navegación revelan que el error de ángulo entre la línea central de navegación extraída utilizando el método de mínimos cuadrados y la línea central ajustada manualmente es inferior a 5 grados. Además, la desviación promedio entre las líneas centrales de carretera extraídas bajo tres condiciones de iluminación diferentes y la línea central de carretera real es solo de 2.66 píxeles, con un tiempo promedio de reconocimiento de imagen de 0.10 s. Este rendimiento sugiere que el estudio puede proporcionar una referencia efectiva para la navegación visual en la agricultura inteligente.