logo móvil
Contáctanos

Red Residual Ancha de Doble Pirámide para Segmentación Semántica en Conjuntos de Datos de Estilo Cruzado

Autores: Shen, Guan-Ting; Huang, Yin-Fu

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Red Residual Ancha de Doble Pirámide para Segmentación Semántica en Conjuntos de Datos de Estilo Cruzado


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Segmentación de imágenes
Segmentación semántica
Red residual de doble pirámide ancha
DPWRN
Pirámide de núcleo
Dilatación
Fusión de múltiples características

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La segmentación de imágenes es el proceso de dividir una imagen en múltiples segmentos, donde el objetivo es simplificar la representación de la imagen y hacerla más significativa y fácil de analizar. En particular, la segmentación semántica es un enfoque para detectar las clases de objetos, basado en cada píxel. En el pasado, la mayoría de los modelos de segmentación semántica eran para un solo estilo, como vistas de calles urbanas, imágenes médicas o incluso manga. En este artículo, proponemos un modelo de segmentación semántica llamado Red Residual Ancha de Doble Pirámide (DPWRN) para resolver la segmentación en conjuntos de datos de estilos cruzados, que es adecuado para diversas aplicaciones de segmentación. El DPWRN integra la Pirámide de Núcleo paralela con Dilatación (PKD) y Fusión de Múltiples Características (MFF) para mejorar la precisión de la segmentación. Para evaluar la generalización del DPWRN y su superioridad sobre la mayoría de los modelos de última generación, se prueban tres conjuntos de datos con estilos completamente diferentes en los experimentos. Como resultado, nuestro modelo logra un 75.95% de mIoU en CamVid, un 83.60% de puntuación F1 en DRIVE y un 86.87% de puntuación F1 en eBDtheque. Esto verifica que el DPWRN puede ser generalizado y muestra su superioridad en la segmentación semántica en conjuntos de datos de estilos cruzados.

Otros recursos que podrían interesarte

Temas Virtualpro