EfferDeepNet: Un método de segmentación semántica eficiente para terrenos al aire libre
Autores: Wei, Yuhai; Wei, Wu; Zhang, Yangbiao
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
EfferDeepNet: Un método de segmentación semántica eficiente para terrenos al aire libre
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Reconocimiento
Terreno al aire libre
Aprendizaje profundo
Estructura de red
Rendimiento en tiempo real
Segmentación semántica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
El reconocimiento de terrenos y entornos complejos al aire libre basado en sensores de visión es una tecnología clave en aplicaciones prácticas de robótica y forma la base de la navegación autónoma y la planificación de movimientos. Si bien se pueden aplicar métodos de aprendizaje automático tradicionales al reconocimiento de terrenos al aire libre, su precisión de reconocimiento es baja. Para mejorar la precisión del reconocimiento de terrenos al aire libre, se utilizan ampliamente métodos basados en aprendizaje profundo. Sin embargo, la estructura de red de los métodos de aprendizaje profundo es muy compleja y el número de parámetros es grande, lo que no puede satisfacer los requisitos operativos reales de los sistemas no tripulados. Por lo tanto, para resolver los problemas de bajo rendimiento en tiempo real y baja precisión de los algoritmos de aprendizaje profundo para el reconocimiento de terrenos, este artículo propone la red eficiente EfferDeepNet para el reconocimiento de terrenos a nivel de píxel con el fin de realizar una percepción global del entorno exterior. Primero, este método utiliza núcleos de convolución de diferentes tamaños en la etapa de convolución separable en profundidad (DSC) para extraer más información de características semánticas. Luego, se introduce un mecanismo de atención para ponderar las características adquiridas, centrándose en las áreas clave de características locales. Finalmente, para evitar la redundancia debido a la gran cantidad de características y parámetros en el modelo, este método utiliza un módulo fantasma para hacer que la red sea más ligera. Además, para resolver el problema de que el reconocimiento de terrenos a nivel de píxel tiene un efecto negativo en la segmentación de bordes de imagen, el método propuesto integra una red de extracción de características mejorada. Los resultados experimentales muestran que la red EfferDeepNet propuesta puede realizar rápidamente y con precisión el reconocimiento global y la segmentación semántica de terrenos en entornos complejos.
Descripción
El reconocimiento de terrenos y entornos complejos al aire libre basado en sensores de visión es una tecnología clave en aplicaciones prácticas de robótica y forma la base de la navegación autónoma y la planificación de movimientos. Si bien se pueden aplicar métodos de aprendizaje automático tradicionales al reconocimiento de terrenos al aire libre, su precisión de reconocimiento es baja. Para mejorar la precisión del reconocimiento de terrenos al aire libre, se utilizan ampliamente métodos basados en aprendizaje profundo. Sin embargo, la estructura de red de los métodos de aprendizaje profundo es muy compleja y el número de parámetros es grande, lo que no puede satisfacer los requisitos operativos reales de los sistemas no tripulados. Por lo tanto, para resolver los problemas de bajo rendimiento en tiempo real y baja precisión de los algoritmos de aprendizaje profundo para el reconocimiento de terrenos, este artículo propone la red eficiente EfferDeepNet para el reconocimiento de terrenos a nivel de píxel con el fin de realizar una percepción global del entorno exterior. Primero, este método utiliza núcleos de convolución de diferentes tamaños en la etapa de convolución separable en profundidad (DSC) para extraer más información de características semánticas. Luego, se introduce un mecanismo de atención para ponderar las características adquiridas, centrándose en las áreas clave de características locales. Finalmente, para evitar la redundancia debido a la gran cantidad de características y parámetros en el modelo, este método utiliza un módulo fantasma para hacer que la red sea más ligera. Además, para resolver el problema de que el reconocimiento de terrenos a nivel de píxel tiene un efecto negativo en la segmentación de bordes de imagen, el método propuesto integra una red de extracción de características mejorada. Los resultados experimentales muestran que la red EfferDeepNet propuesta puede realizar rápidamente y con precisión el reconocimiento global y la segmentación semántica de terrenos en entornos complejos.