Algoritmo de reconocimiento de acciones SlowFast basado en detectores más rápidos y precisos
Autores: Zeng, Wei; Huang, Junjian; Zhang, Wei; Nan, Hai; Fu, Zhenjiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Algoritmo de reconocimiento de acciones SlowFast basado en detectores más rápidos y precisos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Algoritmos de detección
SlowFast
FasterRCNN
YOLOv3
YOLOX
CascadeRCNN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
Los algoritmos de detección de objetos juegan un papel crucial en otras tareas de visión. Este artículo encuentra que el algoritmo de detección de la acción de SlowFast, FasterRCNN (Red Neuronal Convolucional de Región), tiene desventajas en términos de precisión y velocidad de detección, y que la pérdida de localización tradicional IOU (Intersección sobre Unión) es difícil de hacer converger al modelo de detección al punto de estabilidad mínimo. Para resolver los problemas anteriores, el artículo utiliza YOLOv3 (You Only Look Once), YOLOX y CascadeRCNN para mejorar la precisión y velocidad de detección del SlowFast. Este artículo propone una nueva función de pérdida de localización que adopta la distancia Lance y Williams como un nuevo término de penalización. La nueva función de pérdida es más sensible cuando la diferencia de distancia es menor, y esta propiedad es muy adecuada para la convergencia tardía del modelo de detección. Los experimentos se realizaron en el conjunto de datos VOC (Clases Visuales de Objetos) y en el conjunto de datos COCO. En la prueba final de videos, YOLOv3 mejoró la velocidad de detección en 10.5 s. CascadeRCNN mejoró un 3.1%AP en comparación con FasterRCNN en el conjunto de datos COCO. El rendimiento de YOLOX en el conjunto de datos COCO también es en su mayoría mejor que el de FasterRCNN. La nueva función de pérdida de localización LIOU (Intersección sobre Unión de Distancia Lance y Williams) funciona mejor que otras funciones de pérdida en el conjunto de datos VOC. Se puede ver que mejorar el algoritmo de detección del SlowFast parece ser crucial y la función de pérdida propuesta es efectiva.
Descripción
Los algoritmos de detección de objetos juegan un papel crucial en otras tareas de visión. Este artículo encuentra que el algoritmo de detección de la acción de SlowFast, FasterRCNN (Red Neuronal Convolucional de Región), tiene desventajas en términos de precisión y velocidad de detección, y que la pérdida de localización tradicional IOU (Intersección sobre Unión) es difícil de hacer converger al modelo de detección al punto de estabilidad mínimo. Para resolver los problemas anteriores, el artículo utiliza YOLOv3 (You Only Look Once), YOLOX y CascadeRCNN para mejorar la precisión y velocidad de detección del SlowFast. Este artículo propone una nueva función de pérdida de localización que adopta la distancia Lance y Williams como un nuevo término de penalización. La nueva función de pérdida es más sensible cuando la diferencia de distancia es menor, y esta propiedad es muy adecuada para la convergencia tardía del modelo de detección. Los experimentos se realizaron en el conjunto de datos VOC (Clases Visuales de Objetos) y en el conjunto de datos COCO. En la prueba final de videos, YOLOv3 mejoró la velocidad de detección en 10.5 s. CascadeRCNN mejoró un 3.1%AP en comparación con FasterRCNN en el conjunto de datos COCO. El rendimiento de YOLOX en el conjunto de datos COCO también es en su mayoría mejor que el de FasterRCNN. La nueva función de pérdida de localización LIOU (Intersección sobre Unión de Distancia Lance y Williams) funciona mejor que otras funciones de pérdida en el conjunto de datos VOC. Se puede ver que mejorar el algoritmo de detección del SlowFast parece ser crucial y la función de pérdida propuesta es efectiva.