Representación de Múltiples Fuentes Acústicas en una Imagen Virtual del Campo de Audición a Partir del Procesamiento de Apertura Sintética Binaural a Medida que se Gira la Cabeza
Autores: Tamsett, Duncan
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Representación de Múltiples Fuentes Acústicas en una Imagen Virtual del Campo de Audición a Partir del Procesamiento de Apertura Sintética Binaural a Medida que se Gira la Cabeza
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Fuentes acústicas
Cálculo de apertura sintética binaural
Retraso interaural de tiempo
Base de corto tiempo
Función de correlación cruzada
Imagen virtual
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La representación de múltiples fuentes acústicas en una imagen virtual del campo de audición basada en el cálculo de apertura sintética binaural (SAC) se describe mediante el uso de datos simulados de retraso interaural (ITD). Las direcciones hacia las fuentes acústicas pueden ser extraídas de la imagen. Los ITD para múltiples fuentes acústicas en un instante efectivo en el tiempo se implican, por ejemplo, mediante múltiples picos en los coeficientes de una función de correlación cruzada (CCF) de señales acústicas recibidas en las antenas en una base de tiempo corto (~2.25 ms para una separación de antenas de 0.15 m). Los coeficientes de la CCF para tales picos en los retrasos de tiempo medidos para una orientación dada de la cabeza se distienden luego sobre círculos lambda en una imagen acústica instantánea de base de tiempo corto del campo de audición. Numerosas imágenes sucesivas de base de tiempo corto del campo de audición generadas a medida que se gira la cabeza se integran en una imagen acústica de base de tiempo medio (hasta, digamos, 0.5 s) del campo de audición. Esta integración a medida que la cabeza gira constituye un SAC. Las intersecciones de muchos círculos lambda en puntos de la imagen acústica SAC generan máximos en los valores de coeficientes CCF integrados registrados en la imagen. Las posiciones de los máximos representan las direcciones hacia las fuentes acústicas. Las ubicaciones de las fuentes acústicas así derivadas proporcionan entrada para un proceso que gestiona la imagen acústica de base de tiempo largo (>10s de segundos) del campo de audición que representa la visión del mundo acústico ambiental persistente del robot. Las imágenes virtuales podrían opcionalmente mostrarse en monitores externos al robot para ayudar en la depuración del sistema e inspirar el desarrollo continuo.
Descripción
La representación de múltiples fuentes acústicas en una imagen virtual del campo de audición basada en el cálculo de apertura sintética binaural (SAC) se describe mediante el uso de datos simulados de retraso interaural (ITD). Las direcciones hacia las fuentes acústicas pueden ser extraídas de la imagen. Los ITD para múltiples fuentes acústicas en un instante efectivo en el tiempo se implican, por ejemplo, mediante múltiples picos en los coeficientes de una función de correlación cruzada (CCF) de señales acústicas recibidas en las antenas en una base de tiempo corto (~2.25 ms para una separación de antenas de 0.15 m). Los coeficientes de la CCF para tales picos en los retrasos de tiempo medidos para una orientación dada de la cabeza se distienden luego sobre círculos lambda en una imagen acústica instantánea de base de tiempo corto del campo de audición. Numerosas imágenes sucesivas de base de tiempo corto del campo de audición generadas a medida que se gira la cabeza se integran en una imagen acústica de base de tiempo medio (hasta, digamos, 0.5 s) del campo de audición. Esta integración a medida que la cabeza gira constituye un SAC. Las intersecciones de muchos círculos lambda en puntos de la imagen acústica SAC generan máximos en los valores de coeficientes CCF integrados registrados en la imagen. Las posiciones de los máximos representan las direcciones hacia las fuentes acústicas. Las ubicaciones de las fuentes acústicas así derivadas proporcionan entrada para un proceso que gestiona la imagen acústica de base de tiempo largo (>10s de segundos) del campo de audición que representa la visión del mundo acústico ambiental persistente del robot. Las imágenes virtuales podrían opcionalmente mostrarse en monitores externos al robot para ayudar en la depuración del sistema e inspirar el desarrollo continuo.