Modelo CNN con ASPP Multicapa y Cruzado en Dos Pasos para Segmentación Semántica
Autores: Park, Min-Hong; Cho, Jae-Hoon; Kim, Yong-Tae
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Modelo CNN con ASPP Multicapa y Cruzado en Dos Pasos para Segmentación Semántica
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Interés
Segmentación semántica basada en aprendizaje profundo
Campo médico
Operación automática
División de objetos
Estructura de codificador-decodificador
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
Actualmente, el interés en la segmentación semántica basada en aprendizaje profundo está aumentando en varios campos, como el médico, la operación automática y la división de objetos. Por ejemplo, UNet, una red de aprendizaje profundo con una estructura de codificador-decodificador, se utiliza para la segmentación de imágenes en el área biomédica, y se hace un intento de segmentar varios objetos utilizando ASPP como Deeplab. Un estudio reciente mejora la precisión de la segmentación de objetos a través de estructuras que se extienden en varios campos receptivos. La segmentación semántica ha evolucionado para dividir objetos de varios tamaños de manera más precisa y detallada, y se han presentado varios métodos para esto. En este artículo, proponemos una estructura de modelo que reduce los parámetros generales del modelo de aprendizaje profundo en este desarrollo y mejora la precisión. El modelo propuesto es una estructura de codificador-decodificador, y un codificador a mitad de escala proporciona un mapa de características con pocos parámetros de codificador. Un decodificador integra mapas de características de varias escalas con detalles de alta área y características avanzadas de áreas bajas. Un mapa de características integrado aprende un mapa de características de cada jerarquía de codificador sobre un área de datos anteriores en forma de una estructura de acoplamiento continuo. Para verificar el rendimiento del modelo, aprendimos y comparamos el conjunto de datos KITTI-360 con el conjunto de datos Cityscapes, y confirmamos experimentalmente que el método propuesto era superior al modelo existente.
Descripción
Actualmente, el interés en la segmentación semántica basada en aprendizaje profundo está aumentando en varios campos, como el médico, la operación automática y la división de objetos. Por ejemplo, UNet, una red de aprendizaje profundo con una estructura de codificador-decodificador, se utiliza para la segmentación de imágenes en el área biomédica, y se hace un intento de segmentar varios objetos utilizando ASPP como Deeplab. Un estudio reciente mejora la precisión de la segmentación de objetos a través de estructuras que se extienden en varios campos receptivos. La segmentación semántica ha evolucionado para dividir objetos de varios tamaños de manera más precisa y detallada, y se han presentado varios métodos para esto. En este artículo, proponemos una estructura de modelo que reduce los parámetros generales del modelo de aprendizaje profundo en este desarrollo y mejora la precisión. El modelo propuesto es una estructura de codificador-decodificador, y un codificador a mitad de escala proporciona un mapa de características con pocos parámetros de codificador. Un decodificador integra mapas de características de varias escalas con detalles de alta área y características avanzadas de áreas bajas. Un mapa de características integrado aprende un mapa de características de cada jerarquía de codificador sobre un área de datos anteriores en forma de una estructura de acoplamiento continuo. Para verificar el rendimiento del modelo, aprendimos y comparamos el conjunto de datos KITTI-360 con el conjunto de datos Cityscapes, y confirmamos experimentalmente que el método propuesto era superior al modelo existente.