Mejorando el aprendizaje semisupervisado para la clasificación de audio con FixMatch

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Mejorando el aprendizaje semisupervisado para la clasificación de audio con FixMatch

Autores: Grollmisch, Sascha; Cano, Estefanía

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Mejorando el aprendizaje semisupervisado para la clasificación de audio con FixMatch

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Redes neuronales

Aprendizaje semi-supervisado

SSL

Dominio de imágenes

Aumento

Datos de audio

FixMatch

Redes neuronales convolucionales

CNN

Aprendizaje por transferencia

Mean Teacher

Métodos de aumento

Sonidos industriales

Música

Escenas acústicas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones

Incluir datos no etiquetados en el proceso de entrenamiento de redes neuronales utilizando Aprendizaje Semi-Supervisado (SSL) ha mostrado resultados impresionantes en el dominio de imágenes, donde se obtuvieron resultados de vanguardia con solo una fracción de los datos etiquetados. La característica común entre los métodos recientes de SSL es que dependen fuertemente de la ampliación de datos no anotados. Esto está muy poco explorado para datos de audio. En este trabajo, se evalúa SSL utilizando el enfoque de vanguardia FixMatch en tres tareas de clasificación de audio, incluyendo música, sonidos industriales y escenas acústicas. El rendimiento de FixMatch se compara con Redes Neuronales Convolucionales (CNN) entrenadas desde cero, Transfer Learning y SSL utilizando el enfoque de Mean Teacher. Además, se introduce un enfoque simple pero efectivo para seleccionar métodos de aumento adecuados para FixMatch. FixMatch con las modificaciones propuestas siempre superó a Mean Teacher y a las CNN entrenadas desde cero. Para los conjuntos de datos de sonidos industriales y música, el rendimiento de referencia de CNN usando el conjunto de datos completo se alcanzó con menos del 5% de los datos de entrenamiento iniciales, demostrando el potencial de los métodos recientes de SSL para datos de audio. Transfer Learning superó a FixMatch solo para el conjunto de datos más desafiante de clasificación de escenas acústicas, lo que muestra que todavía hay margen para mejorar.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro