Saliency guidance and expansion suppression on PuzzleCAM para segmentación semántica débilmente supervisada
Autores: Chang, Rong-Hsuan; Guo, Jing-Ming; Seshathiri, Sankarasrinivasan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Saliency guidance and expansion suppression on PuzzleCAM para segmentación semántica débilmente supervisada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Segmentación semántica
Supervisión débil
Máscaras pseudo
Mapeo de activación de clase
Módulo guiado por saliencia
Clasificación errónea
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
El modelo de segmentación semántica suele proporcionar predicciones de categoría píxel a píxel para las imágenes. Sin embargo, se requiere una gran cantidad de imágenes con anotaciones píxel a píxel para el entrenamiento del modelo, lo cual es consumidor de tiempo y mano de obra. Recientemente, se ha popularizado una anotación categórica a nivel de imagen que intenta superar el problema anterior en este trabajo. Esto también se denomina segmentación semántica débilmente supervisada, y el marco general tiene como objetivo generar máscaras pseudo con mapeo de activación de clase. Esto se puede aprender a través de tareas de clasificación que se centran en características explícitas. Algunos problemas importantes en estos enfoques son los siguientes: (1) Atención excesiva en áreas específicas; (2) para algunos objetos, el rango detectado va más allá del límite, y (3) las áreas suaves o gradientes de color menores a lo largo del objeto son difíciles de categorizar. Todos estos problemas se abordan de manera integral en este trabajo, principalmente para superar la importancia de centrarse excesivamente en características significativas. El módulo de expansión de supresión se utiliza para disminuir las características centralizadas y expandir la vista de atención. Además, para abordar el problema de clasificación errónea, se adopta el módulo guiado por la saliencia para ayudar en el aprendizaje de la información regional. Limita efectivamente el área del objeto mientras resuelve simultáneamente el desafío del suavizado interno del color. Los resultados experimentales muestran que las máscaras pseudo generadas por la red propuesta pueden lograr 76.0%, 73.3% y 73.5% en mIoU con el conjunto de entrenamiento, validación y prueba de PASCAL VOC 2012, respectivamente, y superan a los métodos de vanguardia.
Descripción
El modelo de segmentación semántica suele proporcionar predicciones de categoría píxel a píxel para las imágenes. Sin embargo, se requiere una gran cantidad de imágenes con anotaciones píxel a píxel para el entrenamiento del modelo, lo cual es consumidor de tiempo y mano de obra. Recientemente, se ha popularizado una anotación categórica a nivel de imagen que intenta superar el problema anterior en este trabajo. Esto también se denomina segmentación semántica débilmente supervisada, y el marco general tiene como objetivo generar máscaras pseudo con mapeo de activación de clase. Esto se puede aprender a través de tareas de clasificación que se centran en características explícitas. Algunos problemas importantes en estos enfoques son los siguientes: (1) Atención excesiva en áreas específicas; (2) para algunos objetos, el rango detectado va más allá del límite, y (3) las áreas suaves o gradientes de color menores a lo largo del objeto son difíciles de categorizar. Todos estos problemas se abordan de manera integral en este trabajo, principalmente para superar la importancia de centrarse excesivamente en características significativas. El módulo de expansión de supresión se utiliza para disminuir las características centralizadas y expandir la vista de atención. Además, para abordar el problema de clasificación errónea, se adopta el módulo guiado por la saliencia para ayudar en el aprendizaje de la información regional. Limita efectivamente el área del objeto mientras resuelve simultáneamente el desafío del suavizado interno del color. Los resultados experimentales muestran que las máscaras pseudo generadas por la red propuesta pueden lograr 76.0%, 73.3% y 73.5% en mIoU con el conjunto de entrenamiento, validación y prueba de PASCAL VOC 2012, respectivamente, y superan a los métodos de vanguardia.