Mejora en el reconocimiento de emociones en el habla utilizando aumento de datos basado en DCGAN
Autores: Baek, Ji-Young; Lee, Seok-Pil
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mejora en el reconocimiento de emociones en el habla utilizando aumento de datos basado en DCGAN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Emocional
Reconocimiento de voz
DCGAN
Datos de mel-espectrograma
CNN
BiLSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 50
Citaciones: Sin citaciones
Aunque el reconocimiento de emociones en el habla ha recibido un énfasis creciente en la investigación y aplicaciones, sigue siendo desafiante debido a la diversidad y complejidad de las emociones y a conjuntos de datos limitados. Para abordar estas limitaciones, proponemos un enfoque novedoso utilizando DCGAN para aumentar los datos de las bases de datos RAVDESS y EmoDB. Luego, evaluamos la eficacia del reconocimiento de emociones utilizando datos de mel-espectrograma mediante un modelo que combina CNN y BiLSTM. Los resultados experimentales preliminares revelan que la técnica sugerida contribuye a mejorar el rendimiento de identificación de emociones en el habla. Los resultados de este estudio proporcionan orientación para un mayor desarrollo en el campo del reconocimiento de emociones en el habla y el potencial para aplicaciones prácticas.
Descripción
Aunque el reconocimiento de emociones en el habla ha recibido un énfasis creciente en la investigación y aplicaciones, sigue siendo desafiante debido a la diversidad y complejidad de las emociones y a conjuntos de datos limitados. Para abordar estas limitaciones, proponemos un enfoque novedoso utilizando DCGAN para aumentar los datos de las bases de datos RAVDESS y EmoDB. Luego, evaluamos la eficacia del reconocimiento de emociones utilizando datos de mel-espectrograma mediante un modelo que combina CNN y BiLSTM. Los resultados experimentales preliminares revelan que la técnica sugerida contribuye a mejorar el rendimiento de identificación de emociones en el habla. Los resultados de este estudio proporcionan orientación para un mayor desarrollo en el campo del reconocimiento de emociones en el habla y el potencial para aplicaciones prácticas.