Mejora: rendimiento del algoritmo de seguimiento de SiamFC basado en la optimización de hiperparámetros convolucionales y filtro de paso bajo
Autores: Kanza, Rogeany; Zhao, Yu; Huang, Zhilin; Huang, Chenyu; Li, Zhuoming
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Mejora: rendimiento del algoritmo de seguimiento de SiamFC basado en la optimización de hiperparámetros convolucionales y filtro de paso bajo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Redes neuronales
Bloque convolucional
Optimización de hiperparámetros
Función de activación
Filtro pasa bajo gaussiano
Rendimiento de seguimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Durante las últimas décadas, las redes neuronales convolucionales (CNN) han logrado resultados sobresalientes en la resolución de una amplia gama de problemas de visión por computadora. A pesar de estas mejoras, las redes neuronales Siamesas totalmente convolucionales (FCSNN) aún se adaptan difícilmente a escenas complejas, como cambios de apariencia, cambios de escala, interferencia de objetos similares, etc. El presente estudio se centra en un FCSNN mejorado basado en la optimización de hiperparámetros de bloques convolucionales, una nueva función de activación (ModReLU) y un filtro paso bajo gaussiano. La optimización de hiperparámetros es una tarea importante, ya que tiene una ascendencia crucial en el rendimiento del proceso de seguimiento, especialmente cuando se trata de la inicialización de pesos y sesgos. Estos deben funcionar eficientemente con la siguiente capa de función de activación. Una inicialización inadecuada puede resultar en gradientes que desaparecen o explotan. En el primer método, proponemos una estrategia de optimización para inicializar pesos y sesgos en el bloque convolucional para mejorar el aprendizaje de características para que cada neurona aprenda tanto como sea posible. Luego, la función de activación normaliza la salida. Implementamos la optimización de hiperparámetros de bloques convolucionales configurando la inicialización de pesos convolucionales a constante, la inicialización de sesgo a cero y la función de activación Leaky ReLU en la salida. En el segundo método, proponemos una nueva activación, ModReLU, en la capa de activación de CNN. Además, también introducimos un filtro paso bajo gaussiano para minimizar el ruido de la imagen y mejorar las estructuras de las imágenes en escalas distintas. Además, agregamos una implementación de ajuste de color basada en el dominio de píxeles para mejorar la capacidad de las estrategias propuestas. Las implementaciones propuestas manejan mejor los problemas de rotación, movimiento, oclusión y cambio de apariencia, y mejoran la velocidad de seguimiento. Nuestros resultados experimentales muestran claramente una mejora significativa en el rendimiento general en comparación con el rastreador SiamFC original. La primera técnica propuesta en este trabajo supera a las redes Siamesas totalmente convolucionales originales (SiamFC) en el conjunto de datos VOT 2016 con un aumento del 15.42% en precisión, 16.79% en AUPC y 15.93% en IOU en comparación con el SiamFC original. Nuestra segunda técnica propuesta también revela avances notables sobre el SiamFC original con un incremento del 18.07% en precisión, una mejora del 17.01% en AUPC y un aumento del 15.87% en IOU. Evaluamos nuestros métodos en el conjunto de datos Visual Object Tracking (VOT) Challenge 2016, y ambos superan el rendimiento del rastreador SiamFC original y muchos otros mejores intérpretes.
Descripción
Durante las últimas décadas, las redes neuronales convolucionales (CNN) han logrado resultados sobresalientes en la resolución de una amplia gama de problemas de visión por computadora. A pesar de estas mejoras, las redes neuronales Siamesas totalmente convolucionales (FCSNN) aún se adaptan difícilmente a escenas complejas, como cambios de apariencia, cambios de escala, interferencia de objetos similares, etc. El presente estudio se centra en un FCSNN mejorado basado en la optimización de hiperparámetros de bloques convolucionales, una nueva función de activación (ModReLU) y un filtro paso bajo gaussiano. La optimización de hiperparámetros es una tarea importante, ya que tiene una ascendencia crucial en el rendimiento del proceso de seguimiento, especialmente cuando se trata de la inicialización de pesos y sesgos. Estos deben funcionar eficientemente con la siguiente capa de función de activación. Una inicialización inadecuada puede resultar en gradientes que desaparecen o explotan. En el primer método, proponemos una estrategia de optimización para inicializar pesos y sesgos en el bloque convolucional para mejorar el aprendizaje de características para que cada neurona aprenda tanto como sea posible. Luego, la función de activación normaliza la salida. Implementamos la optimización de hiperparámetros de bloques convolucionales configurando la inicialización de pesos convolucionales a constante, la inicialización de sesgo a cero y la función de activación Leaky ReLU en la salida. En el segundo método, proponemos una nueva activación, ModReLU, en la capa de activación de CNN. Además, también introducimos un filtro paso bajo gaussiano para minimizar el ruido de la imagen y mejorar las estructuras de las imágenes en escalas distintas. Además, agregamos una implementación de ajuste de color basada en el dominio de píxeles para mejorar la capacidad de las estrategias propuestas. Las implementaciones propuestas manejan mejor los problemas de rotación, movimiento, oclusión y cambio de apariencia, y mejoran la velocidad de seguimiento. Nuestros resultados experimentales muestran claramente una mejora significativa en el rendimiento general en comparación con el rastreador SiamFC original. La primera técnica propuesta en este trabajo supera a las redes Siamesas totalmente convolucionales originales (SiamFC) en el conjunto de datos VOT 2016 con un aumento del 15.42% en precisión, 16.79% en AUPC y 15.93% en IOU en comparación con el SiamFC original. Nuestra segunda técnica propuesta también revela avances notables sobre el SiamFC original con un incremento del 18.07% en precisión, una mejora del 17.01% en AUPC y un aumento del 15.87% en IOU. Evaluamos nuestros métodos en el conjunto de datos Visual Object Tracking (VOT) Challenge 2016, y ambos superan el rendimiento del rastreador SiamFC original y muchos otros mejores intérpretes.