Mejora del algoritmo de segmentación de instancias de carretera basado en el Mask R-CNN modificado
Autores: Wan, Chenxia; Chang, Xianing; Zhang, Qinghui
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mejora del algoritmo de segmentación de instancias de carretera basado en el Mask R-CNN modificado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Mask r-cnn
Segmentación de escenas de carretera
Res2net
Soft-nms
Extracción de características
Precisión de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Aunque el modelo de red neuronal convolucional basado en regiones de máscara (R-CNN) poseía una posición dominante para la segmentación de escenas viales complejas y variables, aún existían algunos problemas, como la capacidad insuficiente de expresión de características y la baja precisión de segmentación. Para abordar estos problemas, se propuso un nuevo algoritmo de segmentación de escenas viales basado en el R-CNN de máscara modificado. Se utilizó la red troncal de múltiples escalas, Res2Net, para reemplazar la red ResNet, con el objetivo de mejorar la capacidad de extracción de características. Se adoptó el algoritmo de supresión suave de no máximos con función de atenuación (soft-NMS) para mejorar la eficiencia de detección en caso de una tasa de superposición más alta. Los análisis de comparación de precisión de partición para varios modelos se realizaron en el conjunto de datos Cityscapes adoptado. Los resultados demostraron que el R-CNN de máscara modificado aumentó efectivamente la precisión de segmentación, especialmente para objetos pequeños y altamente superpuestos. El Res2Net y el soft-NMS adoptados pueden mejorar efectivamente la extracción de características y mejorar el rendimiento de segmentación. La precisión promedio del modelo de R-CNN de máscara modificado alcanzó hasta 0.321, y fue 0.054 más alta que la del Mask R-CNN. Este trabajo proporciona una orientación importante para diseñar un algoritmo de segmentación de instancias de escenas viales más eficiente para promover aún más la aplicación real en sistemas de conducción automática.
Descripción
Aunque el modelo de red neuronal convolucional basado en regiones de máscara (R-CNN) poseía una posición dominante para la segmentación de escenas viales complejas y variables, aún existían algunos problemas, como la capacidad insuficiente de expresión de características y la baja precisión de segmentación. Para abordar estos problemas, se propuso un nuevo algoritmo de segmentación de escenas viales basado en el R-CNN de máscara modificado. Se utilizó la red troncal de múltiples escalas, Res2Net, para reemplazar la red ResNet, con el objetivo de mejorar la capacidad de extracción de características. Se adoptó el algoritmo de supresión suave de no máximos con función de atenuación (soft-NMS) para mejorar la eficiencia de detección en caso de una tasa de superposición más alta. Los análisis de comparación de precisión de partición para varios modelos se realizaron en el conjunto de datos Cityscapes adoptado. Los resultados demostraron que el R-CNN de máscara modificado aumentó efectivamente la precisión de segmentación, especialmente para objetos pequeños y altamente superpuestos. El Res2Net y el soft-NMS adoptados pueden mejorar efectivamente la extracción de características y mejorar el rendimiento de segmentación. La precisión promedio del modelo de R-CNN de máscara modificado alcanzó hasta 0.321, y fue 0.054 más alta que la del Mask R-CNN. Este trabajo proporciona una orientación importante para diseñar un algoritmo de segmentación de instancias de escenas viales más eficiente para promover aún más la aplicación real en sistemas de conducción automática.