Una investigación del método de reconocimiento de tipo de audio ECAPA-TDNN basado en espectrogramas acústicos de Mel
Autores: Wang, Jian; Wang, Zhongzheng; Han, Xingcheng; Han, Yan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Una investigación del método de reconocimiento de tipo de audio ECAPA-TDNN basado en espectrogramas acústicos de Mel
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Señales de audio
Percepción
Condiciones ambientales
Interferencia de ruido
Aprendizaje profundo
Precisión de reconocimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Las señales de audio juegan un papel crucial en nuestra percepción del entorno. Las personas dependen del sonido para evaluar el movimiento, la distancia, la dirección y las condiciones ambientales, lo que ayuda en la evitación de peligros y la toma de decisiones. Sin embargo, en entornos del mundo real, durante la adquisición y transmisión de señales de audio, a menudo nos encontramos con varios tipos de ruidos que interfieren con las señales previstas. Como resultado, las características esenciales de las señales de audio se vuelven significativamente oscurecidas. Bajo la interferencia de ruido fuerte, identificar segmentos de ruido o segmentos de sonido, y distinguir tipos de audio se vuelve fundamental para detectar eventos específicos y patrones de sonido o aislar sonidos anormales. Este estudio analiza las características del espectrograma acústico de Mel, explora la aplicación del método de aprendizaje profundo ECAPA-TDNN para el reconocimiento de tipos de audio, y sustenta su efectividad a través de experimentos. En última instancia, los resultados experimentales demuestran que el método de aprendizaje profundo ECAPA-TDNN para el reconocimiento de tipos de audio, utilizando el espectrograma acústico de Mel como características, logra una precisión de reconocimiento notablemente alta.
Descripción
Las señales de audio juegan un papel crucial en nuestra percepción del entorno. Las personas dependen del sonido para evaluar el movimiento, la distancia, la dirección y las condiciones ambientales, lo que ayuda en la evitación de peligros y la toma de decisiones. Sin embargo, en entornos del mundo real, durante la adquisición y transmisión de señales de audio, a menudo nos encontramos con varios tipos de ruidos que interfieren con las señales previstas. Como resultado, las características esenciales de las señales de audio se vuelven significativamente oscurecidas. Bajo la interferencia de ruido fuerte, identificar segmentos de ruido o segmentos de sonido, y distinguir tipos de audio se vuelve fundamental para detectar eventos específicos y patrones de sonido o aislar sonidos anormales. Este estudio analiza las características del espectrograma acústico de Mel, explora la aplicación del método de aprendizaje profundo ECAPA-TDNN para el reconocimiento de tipos de audio, y sustenta su efectividad a través de experimentos. En última instancia, los resultados experimentales demuestran que el método de aprendizaje profundo ECAPA-TDNN para el reconocimiento de tipos de audio, utilizando el espectrograma acústico de Mel como características, logra una precisión de reconocimiento notablemente alta.