Optimización de arquitecturas de redes neuronales convolucionales utilizando PSO para reconocimiento de lenguaje de señas
Autores: Fregoso, Jonathan; Gonzalez, Claudia I.; Martinez, Gabriela E.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Optimización de arquitecturas de redes neuronales convolucionales utilizando PSO para reconocimiento de lenguaje de señas
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Enfoque
Arquitecturas de redes neuronales convolucionales
Hiperparámetros
Arquitectura de red óptima
Algoritmo PSO
Capas convolucionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Este trabajo presenta un enfoque para diseñar arquitecturas de redes neuronales convolucionales, utilizando el algoritmo de optimización de enjambre de partículas. El ajuste de los hiperparámetros y encontrar la arquitectura de red óptima de las redes neuronales convolucionales representa un desafío importante. El rendimiento de la red y el logro de modelos de aprendizaje eficientes para un problema particular dependen de establecer los valores de los hiperparámetros y esto implica explorar un espacio de búsqueda enorme y complejo. El uso de búsquedas basadas en heurísticas apoya este tipo de problemas; por lo tanto, la principal contribución de este trabajo de investigación es aplicar el algoritmo PSO para encontrar los parámetros óptimos de las redes neuronales convolucionales que incluyen el número de capas convolucionales, el tamaño del filtro utilizado en el proceso de convolución, el número de filtros convolucionales y el tamaño del lote. Este trabajo describe dos enfoques de optimización; el primero, los parámetros obtenidos por PSO se mantienen en las mismas condiciones en cada capa convolucional, y la función objetivo evaluada por PSO se da por la tasa de clasificación; en el segundo, el PSO genera diferentes parámetros por capa, y la función objetivo está compuesta por la tasa de reconocimiento en conjunto con el criterio de información de Akaike, este último ayuda a encontrar el mejor rendimiento de la red pero con el mínimo de parámetros. Las arquitecturas optimizadas se implementan en tres casos de estudio de bases de datos de lenguaje de señas, en los que se incluyen el alfabeto de la Lengua de Señas Mexicana, el MNIST de la Lengua de Señas Americana y el alfabeto de la Lengua de Señas Americana. Según los resultados, las metodologías propuestas lograron resultados favorables con una tasa de reconocimiento superior al 99%, mostrando resultados competitivos en comparación con otros enfoques de vanguardia.
Descripción
Este trabajo presenta un enfoque para diseñar arquitecturas de redes neuronales convolucionales, utilizando el algoritmo de optimización de enjambre de partículas. El ajuste de los hiperparámetros y encontrar la arquitectura de red óptima de las redes neuronales convolucionales representa un desafío importante. El rendimiento de la red y el logro de modelos de aprendizaje eficientes para un problema particular dependen de establecer los valores de los hiperparámetros y esto implica explorar un espacio de búsqueda enorme y complejo. El uso de búsquedas basadas en heurísticas apoya este tipo de problemas; por lo tanto, la principal contribución de este trabajo de investigación es aplicar el algoritmo PSO para encontrar los parámetros óptimos de las redes neuronales convolucionales que incluyen el número de capas convolucionales, el tamaño del filtro utilizado en el proceso de convolución, el número de filtros convolucionales y el tamaño del lote. Este trabajo describe dos enfoques de optimización; el primero, los parámetros obtenidos por PSO se mantienen en las mismas condiciones en cada capa convolucional, y la función objetivo evaluada por PSO se da por la tasa de clasificación; en el segundo, el PSO genera diferentes parámetros por capa, y la función objetivo está compuesta por la tasa de reconocimiento en conjunto con el criterio de información de Akaike, este último ayuda a encontrar el mejor rendimiento de la red pero con el mínimo de parámetros. Las arquitecturas optimizadas se implementan en tres casos de estudio de bases de datos de lenguaje de señas, en los que se incluyen el alfabeto de la Lengua de Señas Mexicana, el MNIST de la Lengua de Señas Americana y el alfabeto de la Lengua de Señas Americana. Según los resultados, las metodologías propuestas lograron resultados favorables con una tasa de reconocimiento superior al 99%, mostrando resultados competitivos en comparación con otros enfoques de vanguardia.