Lasnet: una red de características espaciales asimétricas liviana para segmentación semántica en tiempo real
Autores: Chen, Yu; Zhan, Weida; Jiang, Yichun; Zhu, Depeng; Guo, Renzhong; Xu, Xiaoyu
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Lasnet: una red de características espaciales asimétricas liviana para segmentación semántica en tiempo real
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Segmentación semántica
Ligero
LASNet
Red de características espaciales
Tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
En los últimos años, los modelos de aprendizaje profundo han logrado un gran éxito en el campo de la segmentación semántica, logrando un rendimiento satisfactorio al introducir un gran número de parámetros. Sin embargo, este logro suele conllevar una alta complejidad computacional, lo que limita seriamente la implementación de aplicaciones de segmentación semántica en dispositivos móviles con recursos de computación y almacenamiento limitados. Para abordar este problema, proponemos una red de características espaciales asimétricas ligera (LASNet) para la segmentación semántica en tiempo real. Consideramos los parámetros de la red, la velocidad de inferencia y el rendimiento para diseñar la estructura de LASNet, lo que permite que LASNet se aplique mejor en dispositivos integrados y dispositivos móviles. En la parte de codificación de LASNet, proponemos el módulo LAS, que conserva y utiliza la información espacial. Este módulo utiliza una combinación de convolución asimétrica, convolución de grupo y estructura de doble flujo para reducir el número de parámetros de red y mantener una fuerte capacidad de extracción de características. En la parte de decodificación de LASNet, proponemos el módulo de concatenación multivariante para reutilizar las características superficiales, lo que puede mejorar la precisión de la segmentación y mantener una alta velocidad de inferencia. Nuestra red logra resultados precisos de segmentación en tiempo real en una amplia gama de experimentos. Sin procesamiento adicional y pre-entrenamiento, LASNet logra un mIoU del 70,99% y una velocidad de inferencia de 110,93 FPS en el conjunto de datos CityScapes con solo 0,8 millones de parámetros del modelo.
Descripción
En los últimos años, los modelos de aprendizaje profundo han logrado un gran éxito en el campo de la segmentación semántica, logrando un rendimiento satisfactorio al introducir un gran número de parámetros. Sin embargo, este logro suele conllevar una alta complejidad computacional, lo que limita seriamente la implementación de aplicaciones de segmentación semántica en dispositivos móviles con recursos de computación y almacenamiento limitados. Para abordar este problema, proponemos una red de características espaciales asimétricas ligera (LASNet) para la segmentación semántica en tiempo real. Consideramos los parámetros de la red, la velocidad de inferencia y el rendimiento para diseñar la estructura de LASNet, lo que permite que LASNet se aplique mejor en dispositivos integrados y dispositivos móviles. En la parte de codificación de LASNet, proponemos el módulo LAS, que conserva y utiliza la información espacial. Este módulo utiliza una combinación de convolución asimétrica, convolución de grupo y estructura de doble flujo para reducir el número de parámetros de red y mantener una fuerte capacidad de extracción de características. En la parte de decodificación de LASNet, proponemos el módulo de concatenación multivariante para reutilizar las características superficiales, lo que puede mejorar la precisión de la segmentación y mantener una alta velocidad de inferencia. Nuestra red logra resultados precisos de segmentación en tiempo real en una amplia gama de experimentos. Sin procesamiento adicional y pre-entrenamiento, LASNet logra un mIoU del 70,99% y una velocidad de inferencia de 110,93 FPS en el conjunto de datos CityScapes con solo 0,8 millones de parámetros del modelo.