Acelerador LSTM para Identificación de Objetos Convolutivos
Autores: Savvopoulos, Alkiviadis; Kanavos, Andreas; Mylonas, Phivos; Sioutas, Spyros
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Acelerador LSTM para Identificación de Objetos Convolutivos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aprendizaje profundo
Redes convolucionales
Normalización de lotes
Capas de red neuronal LSTM
Secuencias de imágenes
Compensación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
El Aprendizaje Profundo ha avanzado drásticamente el estado del arte en visión, habla y muchas otras áreas. Recientemente, se han propuesto numerosos algoritmos de aprendizaje profundo para resolver problemas tradicionales de inteligencia artificial. En este documento, con el fin de detectar la versión que pueda proporcionar el mejor equilibrio en términos de tiempo y precisión, se han implementado redes convolucionales de diversas profundidades. También se considera la normalización por lotes ya que actúa como regularizador y logra la misma precisión con menos pasos de entrenamiento. Para maximizar el rendimiento de la complejidad al disminuir, así como minimizar la pérdida de precisión, se utilizan capas de red neuronal LSTM en el proceso. Las secuencias de imágenes se demuestran que son clasificadas por el LSTM de manera más acelerada, logrando una mejor precisión. Concretamente, cuanto más compleja es la CNN, mayores son los porcentajes de exactitud; además, a pesar del aumento de rango en la precisión, el tiempo se redujo significativamente, lo que finalmente hizo que el equilibrio fuera óptimo. La mejora promedio del rendimiento para todos los modelos en relación con ambos conjuntos de datos utilizados ascendió a .
Descripción
El Aprendizaje Profundo ha avanzado drásticamente el estado del arte en visión, habla y muchas otras áreas. Recientemente, se han propuesto numerosos algoritmos de aprendizaje profundo para resolver problemas tradicionales de inteligencia artificial. En este documento, con el fin de detectar la versión que pueda proporcionar el mejor equilibrio en términos de tiempo y precisión, se han implementado redes convolucionales de diversas profundidades. También se considera la normalización por lotes ya que actúa como regularizador y logra la misma precisión con menos pasos de entrenamiento. Para maximizar el rendimiento de la complejidad al disminuir, así como minimizar la pérdida de precisión, se utilizan capas de red neuronal LSTM en el proceso. Las secuencias de imágenes se demuestran que son clasificadas por el LSTM de manera más acelerada, logrando una mejor precisión. Concretamente, cuanto más compleja es la CNN, mayores son los porcentajes de exactitud; además, a pesar del aumento de rango en la precisión, el tiempo se redujo significativamente, lo que finalmente hizo que el equilibrio fuera óptimo. La mejora promedio del rendimiento para todos los modelos en relación con ambos conjuntos de datos utilizados ascendió a .