Pistas Semánticas a Nivel de Píxel y a Nivel de Clase para la Segmentación de Pocas Muestras en Escenas de Trabajo de Astronautas
Autores: Sun, Qingwei; Chao, Jiangang; Lin, Wanhong; Wang, Dongyang; Chen, Wei; Xu, Zhenying; Xie, Shaoli
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Pistas Semánticas a Nivel de Píxel y a Nivel de Clase para la Segmentación de Pocas Muestras en Escenas de Trabajo de Astronautas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Segmentación de pocos ejemplos
FSS
PCNet
Escena de trabajo de astronauta
AWS
Prototipo profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La segmentación de pocos disparos (FSS) es una tecnología de vanguardia que puede satisfacer requisitos utilizando una carga de trabajo pequeña. Con el desarrollo de la Ingeniería Aeroespacial de China, la FSS desempeña un papel fundamental en el análisis inteligente de escenas de trabajo de astronautas (AWS). Aunque los métodos FSS convencionales han logrado avances considerables en datos naturales, no son adecuados para las AWS. Las AWS se caracterizan por un primer plano (FG) y un fondo (BG) similares, categorías indistinguibles y la fuerte influencia de la luz, lo que plantea mayores exigencias a los métodos FSS. Diseñamos una red de características a nivel de píxel y de clase (PCNet) para emparejar características de soporte y consulta utilizando pistas semánticas a nivel de píxel y de clase. Específicamente, PCNet extrae información semántica a nivel de píxel en cada capa de la columna vertebral utilizando una nueva atención cruzada. Prototipos densos se utilizan además para extraer pistas semánticas a nivel de clase como complemento. Además, el prototipo profundo se destila en reversa hacia la capa superficial para mejorar su calidad. Además, personalizamos un conjunto de datos para las AWS y realizamos abundantes experimentos. Los resultados indican que PCNet supera al mejor método publicado en un 4.34% y un 5.15% en precisión bajo configuraciones de un disparo y cinco disparos, respectivamente. Además, PCNet se compara favorablemente con el modelo de segmentación semántica tradicional bajo la configuración de 13 disparos.
Descripción
La segmentación de pocos disparos (FSS) es una tecnología de vanguardia que puede satisfacer requisitos utilizando una carga de trabajo pequeña. Con el desarrollo de la Ingeniería Aeroespacial de China, la FSS desempeña un papel fundamental en el análisis inteligente de escenas de trabajo de astronautas (AWS). Aunque los métodos FSS convencionales han logrado avances considerables en datos naturales, no son adecuados para las AWS. Las AWS se caracterizan por un primer plano (FG) y un fondo (BG) similares, categorías indistinguibles y la fuerte influencia de la luz, lo que plantea mayores exigencias a los métodos FSS. Diseñamos una red de características a nivel de píxel y de clase (PCNet) para emparejar características de soporte y consulta utilizando pistas semánticas a nivel de píxel y de clase. Específicamente, PCNet extrae información semántica a nivel de píxel en cada capa de la columna vertebral utilizando una nueva atención cruzada. Prototipos densos se utilizan además para extraer pistas semánticas a nivel de clase como complemento. Además, el prototipo profundo se destila en reversa hacia la capa superficial para mejorar su calidad. Además, personalizamos un conjunto de datos para las AWS y realizamos abundantes experimentos. Los resultados indican que PCNet supera al mejor método publicado en un 4.34% y un 5.15% en precisión bajo configuraciones de un disparo y cinco disparos, respectivamente. Además, PCNet se compara favorablemente con el modelo de segmentación semántica tradicional bajo la configuración de 13 disparos.