Siamese PointNet: estimación de la pose de la cabeza en 3D con descriptor de características locales
Autores: Wang, Qi; Lei, Hang; Qian, Weizhong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Siamese PointNet: estimación de la pose de la cabeza en 3D con descriptor de características locales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Estimación de la pose de la cabeza
Tecnología de análisis facial
Monitoreo de la atención del conductor
Red Siamesa
Nubes de puntos 3D
Descriptor de características locales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
La estimación de la pose de la cabeza es una parte importante del campo de la tecnología de análisis facial. Puede aplicarse al monitoreo de la atención del conductor, monitoreo de pasajeros, selección efectiva de información, etc. Sin embargo, los cambios de iluminación y la oclusión parcial interfieren con la tarea, y debido a la característica no estacionaria del proceso de cambio de pose de la cabeza, las redes de regresión normales no pueden lograr resultados muy precisos en datos de entrenamiento sintéticos a gran escala. Para abordar los problemas anteriores, se propuso una red Siamesa basada en nubes de puntos 3D, que adopta una red de pesos compartidos con muestras de pose similares para restringir el proceso de regresión de los ángulos de la pose; al mismo tiempo, se introdujo un descriptor de características locales para describir las características geométricas locales de los objetos. Para verificar el rendimiento de nuestro método, realizamos experimentos en dos conjuntos de datos públicos: el conjunto de datos de pose de cabeza Biwi Kinect y Pandora. Los resultados muestran que en comparación con los últimos métodos, nuestra desviación estándar se redujo en 0,4 y el error medio se redujo en 0,1; al mismo tiempo, nuestra red también mantuvo un buen rendimiento en tiempo real.
Descripción
La estimación de la pose de la cabeza es una parte importante del campo de la tecnología de análisis facial. Puede aplicarse al monitoreo de la atención del conductor, monitoreo de pasajeros, selección efectiva de información, etc. Sin embargo, los cambios de iluminación y la oclusión parcial interfieren con la tarea, y debido a la característica no estacionaria del proceso de cambio de pose de la cabeza, las redes de regresión normales no pueden lograr resultados muy precisos en datos de entrenamiento sintéticos a gran escala. Para abordar los problemas anteriores, se propuso una red Siamesa basada en nubes de puntos 3D, que adopta una red de pesos compartidos con muestras de pose similares para restringir el proceso de regresión de los ángulos de la pose; al mismo tiempo, se introdujo un descriptor de características locales para describir las características geométricas locales de los objetos. Para verificar el rendimiento de nuestro método, realizamos experimentos en dos conjuntos de datos públicos: el conjunto de datos de pose de cabeza Biwi Kinect y Pandora. Los resultados muestran que en comparación con los últimos métodos, nuestra desviación estándar se redujo en 0,4 y el error medio se redujo en 0,1; al mismo tiempo, nuestra red también mantuvo un buen rendimiento en tiempo real.