Redes invariables a la rotación para clasificación de imágenes para HPC y sistemas integrados
Autores: Rodriguez Salas, Rosemberg; Dokladal, Petr; Dokladalova, Eva
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Redes invariables a la rotación para clasificación de imágenes para HPC y sistemas integrados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Red neuronal convolucional
Reducción de modelo
Invariante a la rotación
Aumento de datos
Clasificación
ángulo de rotación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
La reducción del tamaño de los modelos de Redes Neuronales Convolucionales (CNNs) ha ganado interés recientemente debido a varias ventajas: reducción del costo energético, dispositivos integrados e interfaces multinúcleo. Una posible forma de lograr la reducción del modelo es el uso de Redes Neuronales Convolucionales Invariantes a la Rotación debido a la posibilidad de evitar técnicas de aumento de datos. En este trabajo, presentamos el siguiente paso para obtener una solución general que dote a las arquitecturas de CNN con la capacidad de clasificar objetos rotados y predecir el ángulo de rotación sin técnicas de aumento de datos. El principio consiste en la concatenación de un mapeo de representación que transforma la rotación en traslación y un predictor de pesos compartidos. Esta solución tiene la ventaja de admitir diferentes combinaciones de varios bloques básicos existentes. Presentamos resultados obtenidos utilizando un banco de filtros Gabor y una estructura de características ResNet en comparación con otras soluciones anteriores. También presentamos la posibilidad de seleccionar entre paralelizar la red en varios hilos para aplicaciones de Computación de Alto Rendimiento (HPC) conscientes de la energía o reducir la huella de memoria para sistemas integrados. Obtenemos una tasa de error competitiva al clasificar MNIST rotado y superamos los resultados actuales de vanguardia en CIFAR-10 cuando se entrena con ejemplos en posición vertical y se valida en orientaciones aleatorias.
Descripción
La reducción del tamaño de los modelos de Redes Neuronales Convolucionales (CNNs) ha ganado interés recientemente debido a varias ventajas: reducción del costo energético, dispositivos integrados e interfaces multinúcleo. Una posible forma de lograr la reducción del modelo es el uso de Redes Neuronales Convolucionales Invariantes a la Rotación debido a la posibilidad de evitar técnicas de aumento de datos. En este trabajo, presentamos el siguiente paso para obtener una solución general que dote a las arquitecturas de CNN con la capacidad de clasificar objetos rotados y predecir el ángulo de rotación sin técnicas de aumento de datos. El principio consiste en la concatenación de un mapeo de representación que transforma la rotación en traslación y un predictor de pesos compartidos. Esta solución tiene la ventaja de admitir diferentes combinaciones de varios bloques básicos existentes. Presentamos resultados obtenidos utilizando un banco de filtros Gabor y una estructura de características ResNet en comparación con otras soluciones anteriores. También presentamos la posibilidad de seleccionar entre paralelizar la red en varios hilos para aplicaciones de Computación de Alto Rendimiento (HPC) conscientes de la energía o reducir la huella de memoria para sistemas integrados. Obtenemos una tasa de error competitiva al clasificar MNIST rotado y superamos los resultados actuales de vanguardia en CIFAR-10 cuando se entrena con ejemplos en posición vertical y se valida en orientaciones aleatorias.