Data augmentation y métodos de aprendizaje profundo en clasificación de sonido: una revisión sistemática
Autores: Abayomi-Alli, Olusola O.; Damaeviius, Robertas; Qazi, Atika; Adedoyin-Olowe, Mariam; Misra, Sanjay
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Data augmentation y métodos de aprendizaje profundo en clasificación de sonido: una revisión sistemática
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Métodos de aumento de datos
Clasificadores de aprendizaje profundo
Datos pequeños
Clasificación de sonido
Métodos de extracción de características
Conjuntos de datos desequilibrados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El objetivo de esta revisión sistemática de la literatura (SLR) es identificar y evaluar críticamente los avances actuales en la investigación con respecto a los datos pequeños y el uso de métodos de aumento de datos para aumentar la cantidad de datos disponibles para clasificadores de aprendizaje profundo para la clasificación de sonido (incluyendo voz, habla y señales de audio relacionadas). Metodología: Esta SLR se llevó a cabo siguiendo las pautas estándar de SLR basadas en PRISMA, y se examinaron tres bases de datos bibliográficas, a saber, Web of Science, SCOPUS y IEEE Xplore. Hallazgos. Los hallazgos iniciales de la búsqueda utilizando varias combinaciones de palabras clave en los últimos cinco años (2017-2021) dieron como resultado un total de 131 artículos. Para seleccionar artículos relevantes que estén dentro del alcance de este estudio, adoptamos algunos criterios de exclusión y la técnica de bola de nieve (bola de nieve hacia adelante y hacia atrás) que resultó en 56 artículos seleccionados. Originalidad: Las deficiencias de estudios de investigación anteriores incluyen la falta de datos suficientes, datos débilmente etiquetados, conjuntos de datos desequilibrados, conjuntos de datos ruidosos, representaciones deficientes de características de sonido y la falta de un enfoque efectivo de aumento que afecta el rendimiento general de los clasificadores, que discutimos en este artículo. Tras el análisis de los artículos identificados, revisamos los conjuntos de datos de sonido, los métodos de extracción de características, las técnicas de aumento de datos y sus aplicaciones en diferentes áreas en el problema de investigación de clasificación de sonido. Finalmente, concluimos con un resumen de la SLR, respuestas a preguntas de investigación y recomendaciones para la tarea de clasificación de sonido.
Descripción
El objetivo de esta revisión sistemática de la literatura (SLR) es identificar y evaluar críticamente los avances actuales en la investigación con respecto a los datos pequeños y el uso de métodos de aumento de datos para aumentar la cantidad de datos disponibles para clasificadores de aprendizaje profundo para la clasificación de sonido (incluyendo voz, habla y señales de audio relacionadas). Metodología: Esta SLR se llevó a cabo siguiendo las pautas estándar de SLR basadas en PRISMA, y se examinaron tres bases de datos bibliográficas, a saber, Web of Science, SCOPUS y IEEE Xplore. Hallazgos. Los hallazgos iniciales de la búsqueda utilizando varias combinaciones de palabras clave en los últimos cinco años (2017-2021) dieron como resultado un total de 131 artículos. Para seleccionar artículos relevantes que estén dentro del alcance de este estudio, adoptamos algunos criterios de exclusión y la técnica de bola de nieve (bola de nieve hacia adelante y hacia atrás) que resultó en 56 artículos seleccionados. Originalidad: Las deficiencias de estudios de investigación anteriores incluyen la falta de datos suficientes, datos débilmente etiquetados, conjuntos de datos desequilibrados, conjuntos de datos ruidosos, representaciones deficientes de características de sonido y la falta de un enfoque efectivo de aumento que afecta el rendimiento general de los clasificadores, que discutimos en este artículo. Tras el análisis de los artículos identificados, revisamos los conjuntos de datos de sonido, los métodos de extracción de características, las técnicas de aumento de datos y sus aplicaciones en diferentes áreas en el problema de investigación de clasificación de sonido. Finalmente, concluimos con un resumen de la SLR, respuestas a preguntas de investigación y recomendaciones para la tarea de clasificación de sonido.