Aprendizaje en conjunto de características acústicas híbridas para el reconocimiento de emociones en el habla
Autores: Zvarevashe, Kudakwashe; Olugbara, Oludayo
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Aprendizaje en conjunto de características acústicas híbridas para el reconocimiento de emociones en el habla
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Reconocimiento
Emoción
Características
Acústico híbrido
Aprendizaje en conjunto
Discurso
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
El reconocimiento automático de emociones es importante para facilitar la interactividad fluida entre un ser humano y un robot inteligente hacia la plena realización de una sociedad inteligente. Los métodos de procesamiento de señales y aprendizaje automático se aplican ampliamente para reconocer las emociones humanas basadas en características extraídas de imágenes faciales, archivos de video o señales de voz. Sin embargo, estas características no pudieron reconocer la emoción del miedo con el mismo nivel de precisión que otras emociones. Los autores proponen la aglutinación de características prosódicas y espectrales de un grupo de características cuidadosamente seleccionadas para realizar características acústicas híbridas con el fin de mejorar la tarea de reconocimiento de emociones. Se realizaron experimentos para probar la efectividad de las características propuestas extraídas de archivos de voz de dos bases de datos públicas y se utilizaron para entrenar cinco algoritmos populares de aprendizaje de conjunto. Los resultados muestran que el aprendizaje de conjunto de bosque de decisión aleatoria de las características acústicas híbridas propuestas es altamente efectivo para el reconocimiento de emociones en el habla.
Descripción
El reconocimiento automático de emociones es importante para facilitar la interactividad fluida entre un ser humano y un robot inteligente hacia la plena realización de una sociedad inteligente. Los métodos de procesamiento de señales y aprendizaje automático se aplican ampliamente para reconocer las emociones humanas basadas en características extraídas de imágenes faciales, archivos de video o señales de voz. Sin embargo, estas características no pudieron reconocer la emoción del miedo con el mismo nivel de precisión que otras emociones. Los autores proponen la aglutinación de características prosódicas y espectrales de un grupo de características cuidadosamente seleccionadas para realizar características acústicas híbridas con el fin de mejorar la tarea de reconocimiento de emociones. Se realizaron experimentos para probar la efectividad de las características propuestas extraídas de archivos de voz de dos bases de datos públicas y se utilizaron para entrenar cinco algoritmos populares de aprendizaje de conjunto. Los resultados muestran que el aprendizaje de conjunto de bosque de decisión aleatoria de las características acústicas híbridas propuestas es altamente efectivo para el reconocimiento de emociones en el habla.