Ajuste fino impulsado por el usuario para el seguimiento de ritmo
Autores: Pinto, António S.; Böck, Sebastian; Cardoso, Jaime S.; Davies, Matthew E. P.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Ajuste fino impulsado por el usuario para el seguimiento de ritmo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Extracción
Ritmo
Señales de audio musicales
Redes neuronales profundas
Conjuntos de datos anotados
Ajuste fino
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
La extracción del pulso de las señales de audio musicales representa una tarea fundamental en el campo de la recuperación de información musical. Aunque se han logrado grandes avances en el rendimiento debido al uso de redes neuronales profundas, todavía existen limitaciones significativas. En particular, el rendimiento suele ser mucho menor en contenido musical que difiere del contenido de los conjuntos de datos anotados existentes utilizados para el entrenamiento de redes neuronales, así como en presencia de condiciones musicales desafiantes. En este documento, posicionamos nuestro enfoque en el seguimiento del pulso desde una perspectiva del mundo real donde un usuario final apunta a una precisión muy alta en piezas musicales específicas y para las cuales el estado actual de la técnica no es efectivo. Con este fin, exploramos el uso de un ajuste fino dirigido de una red neuronal profunda de última generación basada en una región temporal muy limitada de ubicaciones de pulso anotadas. Demostramos el éxito de nuestro enfoque a través de un rendimiento mejorado en los conjuntos de datos anotados existentes y un nuevo enfoque de corrección de anotaciones para la evaluación. Además, destacamos la capacidad del ajuste fino específico del contenido para aprender tanto lo que es como lo que no es el pulso en condiciones musicales desafiantes.
Descripción
La extracción del pulso de las señales de audio musicales representa una tarea fundamental en el campo de la recuperación de información musical. Aunque se han logrado grandes avances en el rendimiento debido al uso de redes neuronales profundas, todavía existen limitaciones significativas. En particular, el rendimiento suele ser mucho menor en contenido musical que difiere del contenido de los conjuntos de datos anotados existentes utilizados para el entrenamiento de redes neuronales, así como en presencia de condiciones musicales desafiantes. En este documento, posicionamos nuestro enfoque en el seguimiento del pulso desde una perspectiva del mundo real donde un usuario final apunta a una precisión muy alta en piezas musicales específicas y para las cuales el estado actual de la técnica no es efectivo. Con este fin, exploramos el uso de un ajuste fino dirigido de una red neuronal profunda de última generación basada en una región temporal muy limitada de ubicaciones de pulso anotadas. Demostramos el éxito de nuestro enfoque a través de un rendimiento mejorado en los conjuntos de datos anotados existentes y un nuevo enfoque de corrección de anotaciones para la evaluación. Además, destacamos la capacidad del ajuste fino específico del contenido para aprender tanto lo que es como lo que no es el pulso en condiciones musicales desafiantes.