logo móvil
Contáctanos

Mejora: rendimiento del algoritmo de seguimiento de SiamFC basado en la optimización de hiperparámetros convolucionales y filtro de paso bajo

Autores: Kanza, Rogeany; Zhao, Yu; Huang, Zhilin; Huang, Chenyu; Li, Zhuoming

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Mejora: rendimiento del algoritmo de seguimiento de SiamFC basado en la optimización de hiperparámetros convolucionales y filtro de paso bajo


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Redes neuronales
Bloque convolucional
Optimización de hiperparámetros
Función de activación
Filtro pasa bajo gaussiano
Rendimiento de seguimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 32

Citaciones: Sin citaciones


Descripción
Durante las últimas décadas, las redes neuronales convolucionales (CNN) han logrado resultados sobresalientes en la resolución de una amplia gama de problemas de visión por computadora. A pesar de estas mejoras, las redes neuronales Siamesas totalmente convolucionales (FCSNN) aún se adaptan difícilmente a escenas complejas, como cambios de apariencia, cambios de escala, interferencia de objetos similares, etc. El presente estudio se centra en un FCSNN mejorado basado en la optimización de hiperparámetros de bloques convolucionales, una nueva función de activación (ModReLU) y un filtro paso bajo gaussiano. La optimización de hiperparámetros es una tarea importante, ya que tiene una ascendencia crucial en el rendimiento del proceso de seguimiento, especialmente cuando se trata de la inicialización de pesos y sesgos. Estos deben funcionar eficientemente con la siguiente capa de función de activación. Una inicialización inadecuada puede resultar en gradientes que desaparecen o explotan. En el primer método, proponemos una estrategia de optimización para inicializar pesos y sesgos en el bloque convolucional para mejorar el aprendizaje de características para que cada neurona aprenda tanto como sea posible. Luego, la función de activación normaliza la salida. Implementamos la optimización de hiperparámetros de bloques convolucionales configurando la inicialización de pesos convolucionales a constante, la inicialización de sesgo a cero y la función de activación Leaky ReLU en la salida. En el segundo método, proponemos una nueva activación, ModReLU, en la capa de activación de CNN. Además, también introducimos un filtro paso bajo gaussiano para minimizar el ruido de la imagen y mejorar las estructuras de las imágenes en escalas distintas. Además, agregamos una implementación de ajuste de color basada en el dominio de píxeles para mejorar la capacidad de las estrategias propuestas. Las implementaciones propuestas manejan mejor los problemas de rotación, movimiento, oclusión y cambio de apariencia, y mejoran la velocidad de seguimiento. Nuestros resultados experimentales muestran claramente una mejora significativa en el rendimiento general en comparación con el rastreador SiamFC original. La primera técnica propuesta en este trabajo supera a las redes Siamesas totalmente convolucionales originales (SiamFC) en el conjunto de datos VOT 2016 con un aumento del 15.42% en precisión, 16.79% en AUPC y 15.93% en IOU en comparación con el SiamFC original. Nuestra segunda técnica propuesta también revela avances notables sobre el SiamFC original con un incremento del 18.07% en precisión, una mejora del 17.01% en AUPC y un aumento del 15.87% en IOU. Evaluamos nuestros métodos en el conjunto de datos Visual Object Tracking (VOT) Challenge 2016, y ambos superan el rendimiento del rastreador SiamFC original y muchos otros mejores intérpretes.

Otros recursos que podrían interesarte

Temas Virtualpro