Red de Pirámide de Características Adaptativa para Predecir Límites Nítidos a través de la Capa NMS y la Función de Pérdida ODS F-Measure
Autores: Sun, Gang; Yu, Hancheng; Jiang, Xiangtao; Feng, Mingkui
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Red de Pirámide de Características Adaptativa para Predecir Límites Nítidos a través de la Capa NMS y la Función de Pérdida ODS F-Measure
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección de bordes
Red neuronal convolucional
Capa de supresión de no máximos
Medida F de ODS
Red de pirámide de características multi-nivel adaptativa
Módulo de contexto de pirámide
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de bordes es una de las tareas fundamentales de la visión por computadora. Los métodos recientes para la detección de bordes basados en una red neuronal convolucional (CNN) suelen emplear la pérdida de entropía cruzada ponderada. Sus resultados predichos son gruesos y necesitan un post-procesamiento antes de calcular la medida F del conjunto de datos óptimo (ODS) para la evaluación. Para lograr un entrenamiento de extremo a extremo, proponemos una capa de supresión de no-máximos (NMS) para obtener bordes nítidos sin necesidad de post-procesamiento. La medida F del ODS se puede calcular en función de estos bordes nítidos. Así, se propone una función de pérdida de medida F del ODS para entrenar la red. Además, proponemos una red de pirámide de características multi-nivel adaptativa (AFPN) para fusionar mejor diferentes niveles de características. Además, para enriquecer las características multi-escala aprendidas por la AFPN, introducimos un módulo de contexto de pirámide (PCM) que incluye convolución dilatada para extraer características multi-escala. Los resultados experimentales indican que la AFPN propuesta logra un rendimiento de vanguardia en el conjunto de datos BSDS500 (puntuación F del ODS de 0.837) y en el conjunto de datos NYUDv2 (puntuación F del ODS de 0.780).
Descripción
La detección de bordes es una de las tareas fundamentales de la visión por computadora. Los métodos recientes para la detección de bordes basados en una red neuronal convolucional (CNN) suelen emplear la pérdida de entropía cruzada ponderada. Sus resultados predichos son gruesos y necesitan un post-procesamiento antes de calcular la medida F del conjunto de datos óptimo (ODS) para la evaluación. Para lograr un entrenamiento de extremo a extremo, proponemos una capa de supresión de no-máximos (NMS) para obtener bordes nítidos sin necesidad de post-procesamiento. La medida F del ODS se puede calcular en función de estos bordes nítidos. Así, se propone una función de pérdida de medida F del ODS para entrenar la red. Además, proponemos una red de pirámide de características multi-nivel adaptativa (AFPN) para fusionar mejor diferentes niveles de características. Además, para enriquecer las características multi-escala aprendidas por la AFPN, introducimos un módulo de contexto de pirámide (PCM) que incluye convolución dilatada para extraer características multi-escala. Los resultados experimentales indican que la AFPN propuesta logra un rendimiento de vanguardia en el conjunto de datos BSDS500 (puntuación F del ODS de 0.837) y en el conjunto de datos NYUDv2 (puntuación F del ODS de 0.780).