Modelo seq2seq basado en Transformer para la generación de progresiones de acordes
Autores: Li, Shuyu; Sung, Yunsick
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Modelo seq2seq basado en Transformer para la generación de progresiones de acordes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje automático
Modelos de aprendizaje profundo
Música
Transformadores
Progresiones de acordes
Melodías
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
El aprendizaje automático se utiliza ampliamente en diversas aplicaciones prácticas, con modelos de aprendizaje profundo que muestran ventajas en el manejo de grandes cantidades de datos. Tratar la música como un lenguaje especial y utilizar modelos de aprendizaje profundo para lograr el reconocimiento de melodías, la generación de música y el análisis musical ha demostrado ser factible. En cierta investigación de aprendizaje profundo relacionada con la música, las redes neuronales recurrentes han sido reemplazadas por transformadores. Esto ha logrado resultados significativos. En enfoques tradicionales con redes neuronales recurrentes, las secuencias de entrada están limitadas en longitud. Este artículo propone un método para generar progresiones de acordes para melodías utilizando un modelo secuencia a secuencia basado en transformadores, que se divide en un codificador y un decodificador pre-entrenados. Un codificador pre-entrenado extrae información contextual de las melodías, mientras que un decodificador utiliza esta información para producir acordes de forma asincrónica y finalmente genera progresiones de acordes. El método propuesto aborda problemas de limitación de longitud al considerar la armonía entre las progresiones de acordes y las melodías. Las progresiones de acordes pueden generarse para melodías en aplicaciones prácticas de composición musical. Se realizaron experimentos de evaluación utilizando el método propuesto y tres modelos base. Los modelos base incluyeron la memoria a corto plazo bidireccional (BLSTM), la representación del codificador bidireccional de transformadores (BERT) y el transformador pre-entrenado generativo (GPT2). El método propuesto superó a los modelos base en ( = 1) en un 25,89 %, 1,54 % y 2,13 %, respectivamente.
Descripción
El aprendizaje automático se utiliza ampliamente en diversas aplicaciones prácticas, con modelos de aprendizaje profundo que muestran ventajas en el manejo de grandes cantidades de datos. Tratar la música como un lenguaje especial y utilizar modelos de aprendizaje profundo para lograr el reconocimiento de melodías, la generación de música y el análisis musical ha demostrado ser factible. En cierta investigación de aprendizaje profundo relacionada con la música, las redes neuronales recurrentes han sido reemplazadas por transformadores. Esto ha logrado resultados significativos. En enfoques tradicionales con redes neuronales recurrentes, las secuencias de entrada están limitadas en longitud. Este artículo propone un método para generar progresiones de acordes para melodías utilizando un modelo secuencia a secuencia basado en transformadores, que se divide en un codificador y un decodificador pre-entrenados. Un codificador pre-entrenado extrae información contextual de las melodías, mientras que un decodificador utiliza esta información para producir acordes de forma asincrónica y finalmente genera progresiones de acordes. El método propuesto aborda problemas de limitación de longitud al considerar la armonía entre las progresiones de acordes y las melodías. Las progresiones de acordes pueden generarse para melodías en aplicaciones prácticas de composición musical. Se realizaron experimentos de evaluación utilizando el método propuesto y tres modelos base. Los modelos base incluyeron la memoria a corto plazo bidireccional (BLSTM), la representación del codificador bidireccional de transformadores (BERT) y el transformador pre-entrenado generativo (GPT2). El método propuesto superó a los modelos base en ( = 1) en un 25,89 %, 1,54 % y 2,13 %, respectivamente.