Gde-pose: un enfoque de compresión adaptativa en tiempo real y fusión dinámica de características multi-escala para estimación de postura
Autores: Kuok, Kaiian; Liu, Xuan; Ye, Jinwei; Wang, Yaokang; Liu, Wenjian
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Gde-pose: un enfoque de compresión adaptativa en tiempo real y fusión dinámica de características multi-escala para estimación de postura
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Introduce
Ligero
Modelo de estimación de postura
GDE-pose
Eficiencia computacional
Ghost Bottleneck
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Este documento presenta un novedoso modelo ligero de estimación de postura, GDE-pose, que aborda el actual compromiso entre precisión y eficiencia computacional en los modelos existentes. GDE-pose se basa en el modelo base YOLO-pose al incorporar Ghost Bottleneck, un Módulo de Fusión de Características Dinámicas (DFFM) y Atención ECA para lograr una representación y selección de características más efectivas. El Ghost Bottleneck reduce la complejidad computacional, DFFM mejora la fusión de características a múltiples escalas y la Atención ECA optimiza la selección de características clave. GDE-pose mejora la precisión de la estimación de postura manteniendo un rendimiento en tiempo real. Los resultados experimentales demuestran que GDE-pose logra una mayor precisión en el conjunto de datos COCO, con una reducción sustancial en parámetros, más del 80% menos de FLOPs y una velocidad de inferencia aumentada de 31 FPS, destacando sus excepcionales capacidades ligeras y en tiempo real. Los estudios de ablación confirman la contribución independiente de cada módulo al rendimiento general del modelo. El diseño de GDE-pose destaca su amplia aplicabilidad en tareas de estimación de postura en tiempo real.
Descripción
Este documento presenta un novedoso modelo ligero de estimación de postura, GDE-pose, que aborda el actual compromiso entre precisión y eficiencia computacional en los modelos existentes. GDE-pose se basa en el modelo base YOLO-pose al incorporar Ghost Bottleneck, un Módulo de Fusión de Características Dinámicas (DFFM) y Atención ECA para lograr una representación y selección de características más efectivas. El Ghost Bottleneck reduce la complejidad computacional, DFFM mejora la fusión de características a múltiples escalas y la Atención ECA optimiza la selección de características clave. GDE-pose mejora la precisión de la estimación de postura manteniendo un rendimiento en tiempo real. Los resultados experimentales demuestran que GDE-pose logra una mayor precisión en el conjunto de datos COCO, con una reducción sustancial en parámetros, más del 80% menos de FLOPs y una velocidad de inferencia aumentada de 31 FPS, destacando sus excepcionales capacidades ligeras y en tiempo real. Los estudios de ablación confirman la contribución independiente de cada módulo al rendimiento general del modelo. El diseño de GDE-pose destaca su amplia aplicabilidad en tareas de estimación de postura en tiempo real.