Abordando píxeles ruidosos en segmentación semántica débilmente supervisada con pesos asignados
Autores: Qian, Feng; Yang, Juan; Tang, Sipeng; Chen, Gao; Yan, Jingwen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Abordando píxeles ruidosos en segmentación semántica débilmente supervisada con pesos asignados
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Supervisión débil
Segmentación semántica
Pseudo-máscaras
Etiquetas ruidosas
Módulo de transformación de peso de incertidumbre
Rendimiento del modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
La segmentación semántica débilmente supervisada (WSSS) tiene como objetivo segmentar objetos sin una carga pesada de anotaciones densas. Las pseudo-máscaras sirven como información supervisora para entrenar modelos de segmentación, lo cual es crucial para el rendimiento de los modelos de segmentación. Sin embargo, las pseudo-máscaras generadas contienen etiquetas ruidosas significativas, lo que lleva a un bajo rendimiento de los modelos de segmentación entrenados con estas pseudo-máscaras. Pocos estudios abordan este problema, ya que estas etiquetas ruidosas siguen siendo inevitables incluso después de mejorar las pseudo-máscaras. En este artículo, proponemos un módulo de transformación de peso de incertidumbre para mitigar el impacto de las etiquetas ruidosas en el rendimiento del modelo. Cabe destacar que nuestro enfoque no tiene como objetivo eliminar las etiquetas ruidosas, sino más bien mejorar la robustez del modelo ante las etiquetas ruidosas. El método propuesto adopta un enfoque basado en la frecuencia para estimar la incertidumbre de los píxeles. Además, la incertidumbre de los píxeles se transforma en pesos de pérdida a través de un conjunto de funciones bien diseñadas. Después de asignar pesos dinámicamente, el modelo asigna atención a cada píxel de manera significativamente diferenciada. Mientras tanto, se debilita el impacto de las etiquetas ruidosas en el rendimiento del modelo. Los experimentos validan la efectividad del método propuesto, logrando resultados de vanguardia del 69.3% en PASCAL VOC 2012 y del 39.3% en MS COCO 2014, respectivamente.
Descripción
La segmentación semántica débilmente supervisada (WSSS) tiene como objetivo segmentar objetos sin una carga pesada de anotaciones densas. Las pseudo-máscaras sirven como información supervisora para entrenar modelos de segmentación, lo cual es crucial para el rendimiento de los modelos de segmentación. Sin embargo, las pseudo-máscaras generadas contienen etiquetas ruidosas significativas, lo que lleva a un bajo rendimiento de los modelos de segmentación entrenados con estas pseudo-máscaras. Pocos estudios abordan este problema, ya que estas etiquetas ruidosas siguen siendo inevitables incluso después de mejorar las pseudo-máscaras. En este artículo, proponemos un módulo de transformación de peso de incertidumbre para mitigar el impacto de las etiquetas ruidosas en el rendimiento del modelo. Cabe destacar que nuestro enfoque no tiene como objetivo eliminar las etiquetas ruidosas, sino más bien mejorar la robustez del modelo ante las etiquetas ruidosas. El método propuesto adopta un enfoque basado en la frecuencia para estimar la incertidumbre de los píxeles. Además, la incertidumbre de los píxeles se transforma en pesos de pérdida a través de un conjunto de funciones bien diseñadas. Después de asignar pesos dinámicamente, el modelo asigna atención a cada píxel de manera significativamente diferenciada. Mientras tanto, se debilita el impacto de las etiquetas ruidosas en el rendimiento del modelo. Los experimentos validan la efectividad del método propuesto, logrando resultados de vanguardia del 69.3% en PASCAL VOC 2012 y del 39.3% en MS COCO 2014, respectivamente.