Segmentación de imagen a partir de descomposición dispersa con una red de detección de objetos preentrenada
Autores: Wu, Yulin; Lv, Chuandong; Ding, Baoqing; Chen, Lei; Zhou, Bin; Zhou, Hongchao
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Segmentación de imagen a partir de descomposición dispersa con una red de detección de objetos preentrenada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Anotaciones
Segmentación de imágenes
Detección de objetos
Aprendizaje no supervisado
Red preentrenada
Máscara de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
La anotación para la segmentación de imágenes es costosa y consume mucho tiempo. A diferencia de la segmentación de imágenes, la tarea de detección de objetos es generalmente más fácil en cuanto a la adquisición de datos de entrenamiento etiquetados y el diseño de modelos de entrenamiento. En este documento, combinamos la idea de aprendizaje no supervisado y una red de detección de objetos preentrenada para realizar la segmentación de imágenes, sin utilizar etiquetas de segmentación costosas. Especialmente, diseñamos una tarea de pretexto basada en la descomposición dispersa de instancias de objetos en videos para obtener la máscara de segmentación de los objetos, lo cual se beneficia de la dispersión de instancias de imágenes y de la estructura entre fotogramas de videos.
Descripción
La anotación para la segmentación de imágenes es costosa y consume mucho tiempo. A diferencia de la segmentación de imágenes, la tarea de detección de objetos es generalmente más fácil en cuanto a la adquisición de datos de entrenamiento etiquetados y el diseño de modelos de entrenamiento. En este documento, combinamos la idea de aprendizaje no supervisado y una red de detección de objetos preentrenada para realizar la segmentación de imágenes, sin utilizar etiquetas de segmentación costosas. Especialmente, diseñamos una tarea de pretexto basada en la descomposición dispersa de instancias de objetos en videos para obtener la máscara de segmentación de los objetos, lo cual se beneficia de la dispersión de instancias de imágenes y de la estructura entre fotogramas de videos.