Automated cnn architectural design: a simple and efficient methodology for computer vision tasks
Autores: Al Bataineh, Ali; Kaur, Devinder; Al-khassaweneh, Mahmood; Al-sharoa, Esraa
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Automated cnn architectural design: a simple and efficient methodology for computer vision tasks
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Redes neuronales convolucionales
Visión por computadora
Búsqueda de arquitectura neuronal
Algoritmo de selección clonal
Clasificación de imágenes
Benchmark EMNIST.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Las redes neuronales convolucionales (CNN) han transformado el campo de la visión por computadora al permitir la extracción automática de características, obviando la necesidad de ingeniería de características manual. A pesar de su éxito, identificar una arquitectura óptima para una tarea particular puede ser un proceso que consume tiempo y desafiante debido al vasto espacio de posibles diseños de red. Para abordar esto, proponemos un marco de búsqueda de arquitectura neuronal (NAS) que utiliza el algoritmo de selección clonal (CSA) para diseñar automáticamente arquitecturas de CNN de alta calidad para problemas de clasificación de imágenes. Nuestro enfoque utiliza una representación vectorial entera para codificar arquitecturas de CNN e hiperparámetros, combinado con un esquema de mutación gaussiano truncado que permite una exploración eficiente del espacio de búsqueda. Evaluamos el método propuesto en seis desafiantes conjuntos de datos de referencia EMNIST para el reconocimiento de dígitos escritos a mano, y nuestros resultados demuestran que supera a casi todos los enfoques existentes. Además, nuestro enfoque produce un rendimiento de vanguardia con menos parámetros entrenables que otros métodos, lo que lo hace económico, simple y reutilizable para su aplicación en múltiples conjuntos de datos.
Descripción
Las redes neuronales convolucionales (CNN) han transformado el campo de la visión por computadora al permitir la extracción automática de características, obviando la necesidad de ingeniería de características manual. A pesar de su éxito, identificar una arquitectura óptima para una tarea particular puede ser un proceso que consume tiempo y desafiante debido al vasto espacio de posibles diseños de red. Para abordar esto, proponemos un marco de búsqueda de arquitectura neuronal (NAS) que utiliza el algoritmo de selección clonal (CSA) para diseñar automáticamente arquitecturas de CNN de alta calidad para problemas de clasificación de imágenes. Nuestro enfoque utiliza una representación vectorial entera para codificar arquitecturas de CNN e hiperparámetros, combinado con un esquema de mutación gaussiano truncado que permite una exploración eficiente del espacio de búsqueda. Evaluamos el método propuesto en seis desafiantes conjuntos de datos de referencia EMNIST para el reconocimiento de dígitos escritos a mano, y nuestros resultados demuestran que supera a casi todos los enfoques existentes. Además, nuestro enfoque produce un rendimiento de vanguardia con menos parámetros entrenables que otros métodos, lo que lo hace económico, simple y reutilizable para su aplicación en múltiples conjuntos de datos.