logo móvil
Contáctanos

Análisis y clasificación de géneros musicales a gran escala utilizando aprendizaje automático con Apache Spark

Autores: Chaudhury, Mousumi; Karami, Amin; Ghazanfar, Mustansar Ali

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Análisis y clasificación de géneros musicales a gran escala utilizando aprendizaje automático con Apache Spark


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Transmisión de música
Escucha de música en línea
Algoritmos de aprendizaje automático
Clasificación de géneros musicales
Apache Spark
Clasificador de bosque aleatorio

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones


Descripción
La tendencia de escuchar música en línea ha aumentado considerablemente en la última década debido al número de pistas musicales en línea. Las grandes bases de datos de música de las bibliotecas musicales proporcionadas por los distribuidores de contenido musical en línea hacen que los servicios de transmisión y descarga de música sean más accesibles para el usuario final. Es esencial clasificar tipos similares de canciones con una etiqueta apropiada o índice (género) para presentar canciones similares de una manera conveniente para el usuario final. A medida que la tendencia de escuchar música en línea sigue aumentando, el desarrollo de múltiples modelos de aprendizaje automático para clasificar géneros musicales se ha convertido en un área principal de investigación. En este documento de investigación, se analiza el popular conjunto de datos de música GTZAN que contiene diez géneros musicales para estudiar varios tipos de características musicales y señales de audio. Se investigan múltiples algoritmos de aprendizaje automático escalables compatibles con Apache Spark, incluidos el Bayes ingenuo, el árbol de decisiones, la regresión logística y el bosque aleatorio, para la clasificación de géneros musicales. Se compara el rendimiento de estos clasificadores, y el bosque aleatorio se desempeña como el mejor clasificador para la clasificación de géneros musicales. Apache Spark se utiliza en este documento para reducir el tiempo de cálculo para las predicciones de aprendizaje automático sin costo computacional, ya que se enfoca en la computación paralela. El trabajo actual también demuestra que la combinación perfecta de Apache Spark y algoritmos de aprendizaje automático reduce el problema de escalabilidad del cálculo de predicciones de aprendizaje automático. Además, se optimizan diferentes hiperparámetros del clasificador de bosque aleatorio para aumentar la eficiencia de rendimiento del clasificador en el dominio de la clasificación de géneros musicales. El resultado experimental muestra que el clasificador de bosque aleatorio desarrollado puede establecer un alto nivel de precisión de rendimiento, especialmente para el conjunto de datos GTZAN mal etiquetado y distorsionado. Este clasificador ha superado a otros clasificadores de aprendizaje automático compatibles con Apache Spark en el trabajo actual. El clasificador de bosque aleatorio logra alcanzar una precisión del 90% para la clasificación de géneros musicales en comparación con otros trabajos en el mismo dominio.

Otros recursos que podrían interesarte

Temas Virtualpro