Aipe: un método novedoso de estimación de postura basado en Transformer
Autores: Lu, Kai; Min, Dugki
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aipe: un método novedoso de estimación de postura basado en Transformer
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Humano
Estimación de postura
Visión por computadora
Red neuronal convolucional
Métodos basados en transformadores
Complejidad computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La estimación de la postura humana es un problema importante en visión por computadora porque es la base para muchas tareas semánticas avanzadas y aplicaciones posteriores. Aunque algunos métodos de estimación de postura basados en redes neuronales convolucionales han logrado buenos resultados, estas redes siguen siendo limitadas para campos receptivos restringidos y poca robustez, lo que lleva a un rendimiento deficiente en escenarios con desenfoque o baja resolución. Además, su estrategia altamente paralelizada probablemente cause demandas computacionales significativas, requiriendo una alta potencia de cálculo. En comparación con las redes neuronales convolucionales, los métodos basados en transformadores ofrecen ventajas como apilamiento flexible, perspectiva global y cálculo paralelo. Basándose en los grandes beneficios, se desarrolla un nuevo método de estimación de postura humana basado en transformadores, que emplea mecanismos de autoatención de múltiples cabezas y ventanas de desplazamiento para suprimir eficazmente el rápido crecimiento de la complejidad computacional cerca de los puntos clave humanos. Los resultados experimentales bajo una comparación visual detallada y análisis cuantitativo demuestran que el método propuesto puede tratar eficientemente el problema de estimación de postura en escenarios desafiantes, como escenas borrosas u ocultas. Además, los errores en el mapeo del esqueleto humano causados por la ocultación u omisión de puntos clave pueden corregirse eficazmente, por lo que la precisión de los resultados de estimación de postura se mejora considerablemente.
Descripción
La estimación de la postura humana es un problema importante en visión por computadora porque es la base para muchas tareas semánticas avanzadas y aplicaciones posteriores. Aunque algunos métodos de estimación de postura basados en redes neuronales convolucionales han logrado buenos resultados, estas redes siguen siendo limitadas para campos receptivos restringidos y poca robustez, lo que lleva a un rendimiento deficiente en escenarios con desenfoque o baja resolución. Además, su estrategia altamente paralelizada probablemente cause demandas computacionales significativas, requiriendo una alta potencia de cálculo. En comparación con las redes neuronales convolucionales, los métodos basados en transformadores ofrecen ventajas como apilamiento flexible, perspectiva global y cálculo paralelo. Basándose en los grandes beneficios, se desarrolla un nuevo método de estimación de postura humana basado en transformadores, que emplea mecanismos de autoatención de múltiples cabezas y ventanas de desplazamiento para suprimir eficazmente el rápido crecimiento de la complejidad computacional cerca de los puntos clave humanos. Los resultados experimentales bajo una comparación visual detallada y análisis cuantitativo demuestran que el método propuesto puede tratar eficientemente el problema de estimación de postura en escenarios desafiantes, como escenas borrosas u ocultas. Además, los errores en el mapeo del esqueleto humano causados por la ocultación u omisión de puntos clave pueden corregirse eficazmente, por lo que la precisión de los resultados de estimación de postura se mejora considerablemente.