logo móvil
Contáctanos

Mejora en el reconocimiento de emociones en el habla utilizando aumento de datos basado en DCGAN

Autores: Baek, Ji-Young; Lee, Seok-Pil

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Mejora en el reconocimiento de emociones en el habla utilizando aumento de datos basado en DCGAN


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Emocional
Reconocimiento de voz
DCGAN
Datos de mel-espectrograma
CNN
BiLSTM

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 50

Citaciones: Sin citaciones


Descripción
Aunque el reconocimiento de emociones en el habla ha recibido un énfasis creciente en la investigación y aplicaciones, sigue siendo desafiante debido a la diversidad y complejidad de las emociones y a conjuntos de datos limitados. Para abordar estas limitaciones, proponemos un enfoque novedoso utilizando DCGAN para aumentar los datos de las bases de datos RAVDESS y EmoDB. Luego, evaluamos la eficacia del reconocimiento de emociones utilizando datos de mel-espectrograma mediante un modelo que combina CNN y BiLSTM. Los resultados experimentales preliminares revelan que la técnica sugerida contribuye a mejorar el rendimiento de identificación de emociones en el habla. Los resultados de este estudio proporcionan orientación para un mayor desarrollo en el campo del reconocimiento de emociones en el habla y el potencial para aplicaciones prácticas.

Otros recursos que podrían interesarte

Temas Virtualpro