logo móvil
Contáctanos

Mejorando el aprendizaje semisupervisado para la clasificación de audio con FixMatch

Autores: Grollmisch, Sascha; Cano, Estefanía

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Mejorando el aprendizaje semisupervisado para la clasificación de audio con FixMatch


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Redes neuronales
Aprendizaje semi-supervisado
SSL
Dominio de imágenes
Aumento
Datos de audio
FixMatch
Redes neuronales convolucionales
CNN
Aprendizaje por transferencia
Mean Teacher
Métodos de aumento
Sonidos industriales
Música
Escenas acústicas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones


Descripción
Incluir datos no etiquetados en el proceso de entrenamiento de redes neuronales utilizando Aprendizaje Semi-Supervisado (SSL) ha mostrado resultados impresionantes en el dominio de imágenes, donde se obtuvieron resultados de vanguardia con solo una fracción de los datos etiquetados. La característica común entre los métodos recientes de SSL es que dependen fuertemente de la ampliación de datos no anotados. Esto está muy poco explorado para datos de audio. En este trabajo, se evalúa SSL utilizando el enfoque de vanguardia FixMatch en tres tareas de clasificación de audio, incluyendo música, sonidos industriales y escenas acústicas. El rendimiento de FixMatch se compara con Redes Neuronales Convolucionales (CNN) entrenadas desde cero, Transfer Learning y SSL utilizando el enfoque de Mean Teacher. Además, se introduce un enfoque simple pero efectivo para seleccionar métodos de aumento adecuados para FixMatch. FixMatch con las modificaciones propuestas siempre superó a Mean Teacher y a las CNN entrenadas desde cero. Para los conjuntos de datos de sonidos industriales y música, el rendimiento de referencia de CNN usando el conjunto de datos completo se alcanzó con menos del 5% de los datos de entrenamiento iniciales, demostrando el potencial de los métodos recientes de SSL para datos de audio. Transfer Learning superó a FixMatch solo para el conjunto de datos más desafiante de clasificación de escenas acústicas, lo que muestra que todavía hay margen para mejorar.

Otros recursos que podrían interesarte

Temas Virtualpro