Una Red de Alta Resolución Ligera Refinada por Atención para la Estimación de Pose de Monos Macacos
Autores: Liu, Sicong; Fan, Qingcheng; Liu, Shanghao; Li, Shuqin; Zhao, Chunjiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una Red de Alta Resolución Ligera Refinada por Atención para la Estimación de Pose de Monos Macacos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Mono macaco
Estimación de pose
Red de alta resolución
Refinado por atención
Ligero
Estructura de transformador
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El mono macaco es un sustituto raro que desempeña un papel importante para los seres humanos en relación con la investigación en ciencias psicológicas y espirituales. Es esencial para estos estudios estimar con precisión la información de la pose de los monos macacos. Muchos modelos a gran escala han logrado resultados de vanguardia en la estimación de la pose de los macacos. Sin embargo, es difícil implementarlos cuando los recursos informáticos son limitados. Combinando la estructura de una red de alta resolución y el principio de diseño de una red ligera, proponemos la red de alta resolución y ligera refinada por atención para la estimación de la pose del mono macaco (HR-MPE). Se adopta una estructura paralela de múltiples ramas para mantener la representación de alta resolución a lo largo del proceso. Además, se diseña un nuevo bloque básico mediante una poderosa estructura de transformador y autoatención polarizada, donde hay una estructura simple y menos parámetros. Se añaden dos bloques refinados por atención al final de la estructura paralela, que están compuestos por convoluciones asimétricas ligeras y una atención tripleta con casi ningún parámetro, obteniendo información de representación más rica. También se utiliza un método de procesamiento de datos imparcial para obtener un resultado de inversión preciso. El experimento se lleva a cabo en un conjunto de datos de macacos que contiene más de 13,000 imágenes. Nuestra red ha alcanzado una puntuación de 77.0 AP, superando a HRFormer con menos parámetros en 1.8 AP.
Descripción
El mono macaco es un sustituto raro que desempeña un papel importante para los seres humanos en relación con la investigación en ciencias psicológicas y espirituales. Es esencial para estos estudios estimar con precisión la información de la pose de los monos macacos. Muchos modelos a gran escala han logrado resultados de vanguardia en la estimación de la pose de los macacos. Sin embargo, es difícil implementarlos cuando los recursos informáticos son limitados. Combinando la estructura de una red de alta resolución y el principio de diseño de una red ligera, proponemos la red de alta resolución y ligera refinada por atención para la estimación de la pose del mono macaco (HR-MPE). Se adopta una estructura paralela de múltiples ramas para mantener la representación de alta resolución a lo largo del proceso. Además, se diseña un nuevo bloque básico mediante una poderosa estructura de transformador y autoatención polarizada, donde hay una estructura simple y menos parámetros. Se añaden dos bloques refinados por atención al final de la estructura paralela, que están compuestos por convoluciones asimétricas ligeras y una atención tripleta con casi ningún parámetro, obteniendo información de representación más rica. También se utiliza un método de procesamiento de datos imparcial para obtener un resultado de inversión preciso. El experimento se lleva a cabo en un conjunto de datos de macacos que contiene más de 13,000 imágenes. Nuestra red ha alcanzado una puntuación de 77.0 AP, superando a HRFormer con menos parámetros en 1.8 AP.