Redes Neuronales Convolucionales Semántico-Estructurales para la Estimación de Pose Humana de Cuerpo Completo
Autores: Li, Weiwei; Du, Rong; Chen, Shudong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Redes Neuronales Convolucionales Semántico-Estructurales para la Estimación de Pose Humana de Cuerpo Completo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Existente
Estimación de pose humana de cuerpo completo
Red de convolución gráfica semántico-estructural
Puntos clave
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los métodos existentes de estimación de pose humana de cuerpo completo segmentan principalmente las partes del cuerpo, como las manos y los pies, para un procesamiento específico, lo que no solo divide la semántica general del cuerpo, sino que también aumenta la cantidad de cálculos y la complejidad del modelo. Para abordar estas desventajas, diseñamos una nueva red de convolución gráfica semántico-estructural (SSGCN) para tareas de estimación de pose humana de cuerpo completo, que aprovecha la estructura gráfica del cuerpo completo para analizar la semántica de los puntos clave del cuerpo a través de una red de convolución gráfica y mejora la precisión de la estimación de la pose. En primer lugar, introdujimos un nuevo embebido de puntos clave basado en mapas de calor, que codifica la información de posición y la información de características de los puntos clave del cuerpo humano. En segundo lugar, proponemos una nueva red de convolución gráfica semántico-estructural que consiste en varios conjuntos de capas gráficas basadas en estructuras en cascada y capas no locales de cuerpo completo dependientes de datos. Específicamente, el método propuesto extrae grupos de puntos clave y construye un gráfico abstracto de cuerpo de alto nivel para procesar la información semántica de alto nivel de los puntos clave del cuerpo completo. Los resultados experimentales mostraron que nuestro método logró resultados muy prometedores en el desafiante conjunto de datos COCO de cuerpo completo.
Descripción
Los métodos existentes de estimación de pose humana de cuerpo completo segmentan principalmente las partes del cuerpo, como las manos y los pies, para un procesamiento específico, lo que no solo divide la semántica general del cuerpo, sino que también aumenta la cantidad de cálculos y la complejidad del modelo. Para abordar estas desventajas, diseñamos una nueva red de convolución gráfica semántico-estructural (SSGCN) para tareas de estimación de pose humana de cuerpo completo, que aprovecha la estructura gráfica del cuerpo completo para analizar la semántica de los puntos clave del cuerpo a través de una red de convolución gráfica y mejora la precisión de la estimación de la pose. En primer lugar, introdujimos un nuevo embebido de puntos clave basado en mapas de calor, que codifica la información de posición y la información de características de los puntos clave del cuerpo humano. En segundo lugar, proponemos una nueva red de convolución gráfica semántico-estructural que consiste en varios conjuntos de capas gráficas basadas en estructuras en cascada y capas no locales de cuerpo completo dependientes de datos. Específicamente, el método propuesto extrae grupos de puntos clave y construye un gráfico abstracto de cuerpo de alto nivel para procesar la información semántica de alto nivel de los puntos clave del cuerpo completo. Los resultados experimentales mostraron que nuestro método logró resultados muy prometedores en el desafiante conjunto de datos COCO de cuerpo completo.