Estimación de azimut y elevación para múltiples fuentes acústicas utilizando matrices de micrófonos tetraédricos y redes neuronales convolucionales
Autores: Sakaviius, Saulius; Serackis, Artras
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Estimación de azimut y elevación para múltiples fuentes acústicas utilizando matrices de micrófonos tetraédricos y redes neuronales convolucionales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Localización de fuente acústica
Conjunto de micrófonos tetraédrico
Red neuronal convolucional
Dirección de llegada
Transformada de Fourier de corto tiempo
Mapa de densidad de probabilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
Se presenta un método para la localización de múltiples fuentes acústicas utilizando un conjunto de micrófonos tetraédrico y una red neuronal convolucional (CNN). Nuestro método presenta un enfoque novedoso para la estimación de la dirección de llegada de la fuente acústica (DoA), tanto en azimut como en elevación, utilizando un conjunto de micrófonos no coplanares. En nuestro enfoque, utilizamos la componente de fase de la transformada de Fourier de corto tiempo (STFT) de las señales del conjunto de micrófonos como característica de entrada para la CNN y un mapa de densidad de probabilidad de DoA como objetivo de entrenamiento. Nuestros hallazgos implican que nuestro método supera a los métodos actualmente disponibles para la estimación de DoA de múltiples fuentes de sonido en términos de precisión y velocidad.
Descripción
Se presenta un método para la localización de múltiples fuentes acústicas utilizando un conjunto de micrófonos tetraédrico y una red neuronal convolucional (CNN). Nuestro método presenta un enfoque novedoso para la estimación de la dirección de llegada de la fuente acústica (DoA), tanto en azimut como en elevación, utilizando un conjunto de micrófonos no coplanares. En nuestro enfoque, utilizamos la componente de fase de la transformada de Fourier de corto tiempo (STFT) de las señales del conjunto de micrófonos como característica de entrada para la CNN y un mapa de densidad de probabilidad de DoA como objetivo de entrenamiento. Nuestros hallazgos implican que nuestro método supera a los métodos actualmente disponibles para la estimación de DoA de múltiples fuentes de sonido en términos de precisión y velocidad.