Reconocimiento de sonido ambiental en sistemas integrados: de FPGAs a TPUs
Autores: Vandendriessche, Jurgen; Wouters, Nick; da Silva, Bruno; Lamrini, Mimoun; Chkouri, Mohamed Yassin; Touhafi, Abdellah
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Reconocimiento de sonido ambiental en sistemas integrados: de FPGAs a TPUs
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reconocimiento de sonidos ambientales
Enfoques de aprendizaje automático
Redes neuronales convolucionales
Matrices de puertas programables en campo
Inteligencia artificial
Unidades de procesamiento tensorial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
En los últimos años, el reconocimiento de sonido ambiental (ESR) se ha convertido en una capacidad relevante para aplicaciones de monitoreo urbano. Las técnicas para el reconocimiento automático de sonidos a menudo se basan en enfoques de aprendizaje automático, que han aumentado en complejidad para lograr una mayor precisión. Sin embargo, dichas técnicas de aprendizaje automático a menudo deben implementarse en dispositivos integrados con recursos limitados de energía, lo que se ha convertido en un desafío con la adopción de enfoques de aprendizaje profundo basados en Redes Neuronales Convolucionales (CNNs). Las matrices de puertas programables en campo (FPGAs) son eficientes en energía y altamente adecuadas para algoritmos intensivos en computación como las CNNs. Al explotar completamente su naturaleza paralela, tienen el potencial de acelerar el tiempo de inferencia en comparación con otros dispositivos integrados. De manera similar, arquitecturas dedicadas para acelerar la Inteligencia Artificial (IA) como las Unidades de Procesamiento Tensorial (TPUs) prometen ofrecer alta precisión al tiempo que logran un alto rendimiento. En este trabajo, evaluamos flujos de herramientas existentes para implementar modelos de CNN en FPGAs y en plataformas TPU. Proponemos y ajustamos varios clasificadores de sonido basados en CNN para ser integrados en dichos aceleradores de hardware. Los resultados demuestran la madurez de las herramientas existentes y cómo las FPGAs pueden ser explotadas para superar a las TPUs.
Descripción
En los últimos años, el reconocimiento de sonido ambiental (ESR) se ha convertido en una capacidad relevante para aplicaciones de monitoreo urbano. Las técnicas para el reconocimiento automático de sonidos a menudo se basan en enfoques de aprendizaje automático, que han aumentado en complejidad para lograr una mayor precisión. Sin embargo, dichas técnicas de aprendizaje automático a menudo deben implementarse en dispositivos integrados con recursos limitados de energía, lo que se ha convertido en un desafío con la adopción de enfoques de aprendizaje profundo basados en Redes Neuronales Convolucionales (CNNs). Las matrices de puertas programables en campo (FPGAs) son eficientes en energía y altamente adecuadas para algoritmos intensivos en computación como las CNNs. Al explotar completamente su naturaleza paralela, tienen el potencial de acelerar el tiempo de inferencia en comparación con otros dispositivos integrados. De manera similar, arquitecturas dedicadas para acelerar la Inteligencia Artificial (IA) como las Unidades de Procesamiento Tensorial (TPUs) prometen ofrecer alta precisión al tiempo que logran un alto rendimiento. En este trabajo, evaluamos flujos de herramientas existentes para implementar modelos de CNN en FPGAs y en plataformas TPU. Proponemos y ajustamos varios clasificadores de sonido basados en CNN para ser integrados en dichos aceleradores de hardware. Los resultados demuestran la madurez de las herramientas existentes y cómo las FPGAs pueden ser explotadas para superar a las TPUs.