OTNet: un algoritmo de detección de objetos pequeños para video inspirado por el sistema visual aviar
Autores: Hu, Pingge; Wang, Xingtong; Zhang, Xiaoteng; Cang, Yueyang; Shi, Li
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
OTNet: un algoritmo de detección de objetos pequeños para video inspirado por el sistema visual aviar
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Detección de objetos pequeños
Visión por computadora
Algoritmo centrado en la ubicación
OTNet
Mapa de saliencia
Sistema visual aviar
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La detección de objetos pequeños es uno de los campos más desafiantes y no despreciables en visión por computadora. Inspirados por el proceso de localización-enfoque-identificación del sistema visual aviar, presentamos nuestro algoritmo de detección de objetos pequeños enfocado en la ubicación para secuencias de video o imágenes, OTNet. El modelo contiene tres módulos correspondientes a las formas de saliencia, que generan la respuesta más fuerte de OT para calcular el mapa de saliencia. Los tres módulos son responsables de la extracción de características espacio-temporales, extracción de características espaciales y coincidencia de memoria, respectivamente. Probamos nuestro modelo en el conjunto de datos AU-AIR y logramos hasta un 97.95% de tasa de recuperación, 85.73% de tasa de precisión y un puntaje de 89.94 con una menor complejidad computacional. Nuestro modelo también puede funcionar como un módulo complementario para otros modelos de detección de objetos para mejorar su rendimiento en imágenes de vista de pájaro, especialmente para detectar objetos más pequeños. Logramos mejorar el rendimiento de detección en hasta un 40.01%. Los resultados muestran que nuestro modelo se desempeña bien en las métricas comunes de detección, mientras simula el procesamiento de información visual para la localización de objetos en el cerebro aviar.
Descripción
La detección de objetos pequeños es uno de los campos más desafiantes y no despreciables en visión por computadora. Inspirados por el proceso de localización-enfoque-identificación del sistema visual aviar, presentamos nuestro algoritmo de detección de objetos pequeños enfocado en la ubicación para secuencias de video o imágenes, OTNet. El modelo contiene tres módulos correspondientes a las formas de saliencia, que generan la respuesta más fuerte de OT para calcular el mapa de saliencia. Los tres módulos son responsables de la extracción de características espacio-temporales, extracción de características espaciales y coincidencia de memoria, respectivamente. Probamos nuestro modelo en el conjunto de datos AU-AIR y logramos hasta un 97.95% de tasa de recuperación, 85.73% de tasa de precisión y un puntaje de 89.94 con una menor complejidad computacional. Nuestro modelo también puede funcionar como un módulo complementario para otros modelos de detección de objetos para mejorar su rendimiento en imágenes de vista de pájaro, especialmente para detectar objetos más pequeños. Logramos mejorar el rendimiento de detección en hasta un 40.01%. Los resultados muestran que nuestro modelo se desempeña bien en las métricas comunes de detección, mientras simula el procesamiento de información visual para la localización de objetos en el cerebro aviar.