Predicción de Funciones de Transferencia Relacionadas con la Cabeza Usando Enfoques de Aprendizaje Automático
Autores: Fernandez Martinez, Roberto; Jimbert, Pello; Sumner, Eric Michael; Riedel, Morris; Unnthorsson, Runar
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Predicción de Funciones de Transferencia Relacionadas con la Cabeza Usando Enfoques de Aprendizaje Automático
Categoría
Artes
Subcategoría
Música
Palabras clave
Generación
Espacio auditivo virtual
HRTFs
Información antropométrica
Calidad del sonido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
La generación de un espacio auditivo virtual, personal, para obtener una experiencia sonora de alta calidad al usar auriculares es de gran importancia. Normalmente, esta experiencia se mejora utilizando funciones de transferencia relacionadas con la cabeza (HRTFs) personalizadas que dependen en gran medida de información antropométrica personal sobre las orejas. La mayoría de los estudios centran su análisis de optimización auditiva personal en el estudio de la amplitud frente a la frecuencia en las HRTFs, principalmente en la búsqueda de pistas de elevación significativas de los mapas de frecuencia. Por lo tanto, conocer las HRTFs de cada individuo es de considerable ayuda para mejorar la calidad del sonido. El siguiente trabajo propone una metodología para modelar las HRTFs de acuerdo con la estructura individual de las orejas utilizando técnicas de perceptrón multicapa y regresión lineal. Se propone generar varios modelos que permitan conocer la amplitud de las HRTFs para cada frecuencia basada en los datos antropométricos personales sobre las orejas, el ángulo de acimut y la elevación de la fuente sonora, prediciendo así las magnitudes de frecuencia. Los experimentos muestran que la predicción de nuevas HRTF personales genera bajos errores, por lo que este modelo puede aplicarse a nuevas cabezas con diferentes características de orejas con alta confianza. Mejorando los resultados obtenidos con la oreja estándar KEMAR, que se utiliza generalmente en casos donde hay falta de información.
Descripción
La generación de un espacio auditivo virtual, personal, para obtener una experiencia sonora de alta calidad al usar auriculares es de gran importancia. Normalmente, esta experiencia se mejora utilizando funciones de transferencia relacionadas con la cabeza (HRTFs) personalizadas que dependen en gran medida de información antropométrica personal sobre las orejas. La mayoría de los estudios centran su análisis de optimización auditiva personal en el estudio de la amplitud frente a la frecuencia en las HRTFs, principalmente en la búsqueda de pistas de elevación significativas de los mapas de frecuencia. Por lo tanto, conocer las HRTFs de cada individuo es de considerable ayuda para mejorar la calidad del sonido. El siguiente trabajo propone una metodología para modelar las HRTFs de acuerdo con la estructura individual de las orejas utilizando técnicas de perceptrón multicapa y regresión lineal. Se propone generar varios modelos que permitan conocer la amplitud de las HRTFs para cada frecuencia basada en los datos antropométricos personales sobre las orejas, el ángulo de acimut y la elevación de la fuente sonora, prediciendo así las magnitudes de frecuencia. Los experimentos muestran que la predicción de nuevas HRTF personales genera bajos errores, por lo que este modelo puede aplicarse a nuevas cabezas con diferentes características de orejas con alta confianza. Mejorando los resultados obtenidos con la oreja estándar KEMAR, que se utiliza generalmente en casos donde hay falta de información.