Identificando la fuente acústica a través de MFF-ResNet con baja complejidad de muestra
Autores: Cui, Min; Liu, Yang; Wang, Yanbo; Wang, Pan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Identificando la fuente acústica a través de MFF-ResNet con baja complejidad de muestra
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Señal acústica
Clasificación
Baja complejidad de muestra
Métodos de aprendizaje profundo
Modelo de fusión de datos
MFF-ResNet
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
La clasificación de señales acústicas juega un papel central en la identificación de fuentes acústicas. En aplicaciones prácticas, sin embargo, las variedades de datos de entrenamiento suelen ser inadecuadas, lo que conduce a una baja complejidad de muestra. Aplicar métodos clásicos de aprendizaje profundo para identificar señales acústicas implica un gran número de parámetros en el modelo de clasificación, lo que requiere una gran complejidad de muestra. Por lo tanto, la modelización de baja complejidad de muestra es uno de los problemas más importantes relacionados con el rendimiento de la clasificación de señales acústicas. En este estudio, los autores proponen un nuevo modelo de fusión de datos llamado MFF-ResNet, en el que se fusionan características de diseño manual y representación profunda de características de espectrograma log-Mel con atención de dos niveles. El enfoque propuesto implica una cantidad de conocimiento humano previo como regularización implícita, lo que conduce a un modelo interpretable y de baja complejidad de muestra de la clasificación de señales acústicas. Los resultados experimentales sugirieron que MFF-ResNet es capaz de clasificar señales acústicas con precisión con menos muestras de entrenamiento.
Descripción
La clasificación de señales acústicas juega un papel central en la identificación de fuentes acústicas. En aplicaciones prácticas, sin embargo, las variedades de datos de entrenamiento suelen ser inadecuadas, lo que conduce a una baja complejidad de muestra. Aplicar métodos clásicos de aprendizaje profundo para identificar señales acústicas implica un gran número de parámetros en el modelo de clasificación, lo que requiere una gran complejidad de muestra. Por lo tanto, la modelización de baja complejidad de muestra es uno de los problemas más importantes relacionados con el rendimiento de la clasificación de señales acústicas. En este estudio, los autores proponen un nuevo modelo de fusión de datos llamado MFF-ResNet, en el que se fusionan características de diseño manual y representación profunda de características de espectrograma log-Mel con atención de dos niveles. El enfoque propuesto implica una cantidad de conocimiento humano previo como regularización implícita, lo que conduce a un modelo interpretable y de baja complejidad de muestra de la clasificación de señales acústicas. Los resultados experimentales sugirieron que MFF-ResNet es capaz de clasificar señales acústicas con precisión con menos muestras de entrenamiento.