Similaridad de timbres musicales utilizando análisis de descriptores acústicos FFT y aprendizaje automático
Autores: Gonzalez, Yubiry; Prati, Ronaldo C.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Similaridad de timbres musicales utilizando análisis de descriptores acústicos FFT y aprendizaje automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería General
Palabras clave
Timbre musical
Percepción auditiva
Propiedades físicas
Fuente de sonido
Reconocimiento
Similitud timbral
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
El timbre musical es un fenómeno de percepción auditiva que permite el reconocimiento de sonidos musicales. El reconocimiento del timbre musical es una tarea desafiante porque el timbre de un instrumento musical o fuente de sonido es un fenómeno complejo y multifacético que está influenciado por una variedad de factores, incluyendo las propiedades físicas del instrumento o fuente de sonido, la forma en que se toca o se produce, y las técnicas de grabación y procesamiento utilizadas. En este documento, exploramos un espacio abstracto con 7 dimensiones formado por la frecuencia fundamental y Descriptores Acústicos FFT en 240 sonidos monofónicos de las bases de datos Tinysol y Good-Sounds, correspondientes a la cuarta octava de la flauta travesera y el clarinete. Este enfoque nos permite definir de manera inequívoca una colección de puntos y, por lo tanto, un espacio timbral (Teoría de Categorías) que permite representar diferentes sonidos de cualquier tipo de instrumento musical con sus respectivas dinámicas como un vector característico único. La distancia geométrica permitiría estudiar la similitud timbral entre audios de diferentes sonidos e instrumentos o entre diferentes dinámicas y conjuntos de datos musicales. Además, se propuso un algoritmo de Aprendizaje Automático que evalúa las similitudes timbrales a través de distancias euclidianas en el espacio abstracto de 7 dimensiones. Concluimos que el estudio de la similitud timbral a través de distancias geométricas nos permitió distinguir entre categorías de audio de diferentes sonidos e instrumentos musicales, entre el mismo tipo de sonido y un instrumento con dinámicas relativas diferentes, y entre diferentes conjuntos de datos.
Descripción
El timbre musical es un fenómeno de percepción auditiva que permite el reconocimiento de sonidos musicales. El reconocimiento del timbre musical es una tarea desafiante porque el timbre de un instrumento musical o fuente de sonido es un fenómeno complejo y multifacético que está influenciado por una variedad de factores, incluyendo las propiedades físicas del instrumento o fuente de sonido, la forma en que se toca o se produce, y las técnicas de grabación y procesamiento utilizadas. En este documento, exploramos un espacio abstracto con 7 dimensiones formado por la frecuencia fundamental y Descriptores Acústicos FFT en 240 sonidos monofónicos de las bases de datos Tinysol y Good-Sounds, correspondientes a la cuarta octava de la flauta travesera y el clarinete. Este enfoque nos permite definir de manera inequívoca una colección de puntos y, por lo tanto, un espacio timbral (Teoría de Categorías) que permite representar diferentes sonidos de cualquier tipo de instrumento musical con sus respectivas dinámicas como un vector característico único. La distancia geométrica permitiría estudiar la similitud timbral entre audios de diferentes sonidos e instrumentos o entre diferentes dinámicas y conjuntos de datos musicales. Además, se propuso un algoritmo de Aprendizaje Automático que evalúa las similitudes timbrales a través de distancias euclidianas en el espacio abstracto de 7 dimensiones. Concluimos que el estudio de la similitud timbral a través de distancias geométricas nos permitió distinguir entre categorías de audio de diferentes sonidos e instrumentos musicales, entre el mismo tipo de sonido y un instrumento con dinámicas relativas diferentes, y entre diferentes conjuntos de datos.