Combinación de red parcial de etapa cruzada profunda y agrupamiento piramidal espacial para detección automática de manos
Autores: Dewi, Christine; Juli Christanto, Henoch
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Combinación de red parcial de etapa cruzada profunda y agrupamiento piramidal espacial para detección automática de manos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Mano
Visión por computadora
Detección
Algoritmos
CNN
Yolo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
La mano humana está involucrada en muchas tareas de visión por computadora, como la estimación de postura de la mano, identificación de movimiento de la mano, análisis de actividad humana y otras tareas similares, en las que la detección de la mano es un paso de preprocesamiento importante. Todavía es difícil reconocer correctamente algunas manos en un entorno desordenado debido a las variaciones complejas de visualización de las ágiles manos humanas y al hecho de que tienen un amplio rango de movimiento. En este estudio, proporcionamos una breve evaluación de los algoritmos de identificación de objetos basados en CNN, específicamente Densenet Yolo V2, Densenet Yolo V2 CSP, Densenet Yolo V2 CSP SPP, Resnet 50 Yolo V2, Resnet 50 CSP, Resnet 50 CSP SPP, Yolo V4 SPP, Yolo V4 CSP SPP y Yolo V5. Las ventajas de CSP y SPP se examinan a fondo y se describen detalladamente en cada algoritmo. Mostramos en nuestros experimentos que Yolo V4 CSP SPP proporciona el mejor nivel de precisión disponible. Los resultados experimentales muestran que las capas CSP y SPP ayudan a mejorar la precisión del rendimiento de prueba del modelo CNN. Nuestro modelo aprovecha las ventajas de CSP y SPP. Nuestro método propuesto Yolo V4 CSP SPP superó los resultados de investigaciones anteriores en un promedio del 8,88%, con una mejora del 87,6% al 96,48%.
Descripción
La mano humana está involucrada en muchas tareas de visión por computadora, como la estimación de postura de la mano, identificación de movimiento de la mano, análisis de actividad humana y otras tareas similares, en las que la detección de la mano es un paso de preprocesamiento importante. Todavía es difícil reconocer correctamente algunas manos en un entorno desordenado debido a las variaciones complejas de visualización de las ágiles manos humanas y al hecho de que tienen un amplio rango de movimiento. En este estudio, proporcionamos una breve evaluación de los algoritmos de identificación de objetos basados en CNN, específicamente Densenet Yolo V2, Densenet Yolo V2 CSP, Densenet Yolo V2 CSP SPP, Resnet 50 Yolo V2, Resnet 50 CSP, Resnet 50 CSP SPP, Yolo V4 SPP, Yolo V4 CSP SPP y Yolo V5. Las ventajas de CSP y SPP se examinan a fondo y se describen detalladamente en cada algoritmo. Mostramos en nuestros experimentos que Yolo V4 CSP SPP proporciona el mejor nivel de precisión disponible. Los resultados experimentales muestran que las capas CSP y SPP ayudan a mejorar la precisión del rendimiento de prueba del modelo CNN. Nuestro modelo aprovecha las ventajas de CSP y SPP. Nuestro método propuesto Yolo V4 CSP SPP superó los resultados de investigaciones anteriores en un promedio del 8,88%, con una mejora del 87,6% al 96,48%.