Arquitectura profunda de segmentación semántica cuantizada para implementación en un dispositivo de computación en el borde para segmentación de imágenes
Autores: Ahamad, Afaroj; Sun, Chi-Chia; Kuo, Wen-Kai
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Arquitectura profunda de segmentación semántica cuantizada para implementación en un dispositivo de computación en el borde para segmentación de imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Campo
Tecnología de visión por computadora
Aprendizaje profundo
Procesamiento de imágenes
Segmentación semántica
Red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
En el campo de la tecnología de visión por computadora, el aprendizaje profundo del procesamiento de imágenes se ha convertido en un área de investigación emergente. La segmentación semántica de una imagen es una de las tareas más esenciales y significativas en la investigación de procesamiento de imágenes, ofreciendo una amplia gama de campos de aplicación como sistemas de conducción autónoma, diagnóstico médico, seguridad de vigilancia, etc. Hasta ahora, muchos estudios han sugerido y desarrollado módulos de redes neuronales en aprendizaje profundo. Hasta donde sabemos, todas las redes neuronales existentes para la segmentación semántica tienen tamaños de parámetros grandes y, por lo tanto, resulta imposible implementar esas arquitecturas en plataformas integradas de baja potencia y memoria limitada como FPGAs. Construir una plataforma integrada con esa arquitectura es posible después de reducir el tamaño de los parámetros sin afectar la arquitectura del módulo. La técnica de cuantificación reduce la precisión de los parámetros de la red neuronal mientras mantiene en su mayoría la precisión. En este documento, proponemos un algoritmo de cuantificación para una arquitectura de aprendizaje profundo de segmentación semántica, que reduce el tamaño de los parámetros de cuatro a ocho veces con una disminución de precisión despreciable. Siempre que se reduzca el tamaño de los parámetros, la arquitectura de aprendizaje profundo mejora en términos de almacenamiento requerido, velocidad computacional y eficiencia energética.
Descripción
En el campo de la tecnología de visión por computadora, el aprendizaje profundo del procesamiento de imágenes se ha convertido en un área de investigación emergente. La segmentación semántica de una imagen es una de las tareas más esenciales y significativas en la investigación de procesamiento de imágenes, ofreciendo una amplia gama de campos de aplicación como sistemas de conducción autónoma, diagnóstico médico, seguridad de vigilancia, etc. Hasta ahora, muchos estudios han sugerido y desarrollado módulos de redes neuronales en aprendizaje profundo. Hasta donde sabemos, todas las redes neuronales existentes para la segmentación semántica tienen tamaños de parámetros grandes y, por lo tanto, resulta imposible implementar esas arquitecturas en plataformas integradas de baja potencia y memoria limitada como FPGAs. Construir una plataforma integrada con esa arquitectura es posible después de reducir el tamaño de los parámetros sin afectar la arquitectura del módulo. La técnica de cuantificación reduce la precisión de los parámetros de la red neuronal mientras mantiene en su mayoría la precisión. En este documento, proponemos un algoritmo de cuantificación para una arquitectura de aprendizaje profundo de segmentación semántica, que reduce el tamaño de los parámetros de cuatro a ocho veces con una disminución de precisión despreciable. Siempre que se reduzca el tamaño de los parámetros, la arquitectura de aprendizaje profundo mejora en términos de almacenamiento requerido, velocidad computacional y eficiencia energética.