Análisis de variabilidad emocional basado en I-Vector para verificación de locutor en condiciones de estrés
Autores: Prasetio, Barlian Henryranu; Tamura, Hiroki; Tanno, Koichi
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Análisis de variabilidad emocional basado en I-Vector para verificación de locutor en condiciones de estrés
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Condiciones emocionales
Sistema de producción de habla
Sistema de verificación de locutor
Modelado de locutor
Análisis de variabilidad emocional
Técnica i-vector
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Las condiciones emocionales causan cambios en el sistema de producción del habla. Produce diferencias en las características acústicas en comparación con condiciones neutrales. La presencia de emoción hace que el rendimiento de un sistema de verificación de hablantes se degrade. En este documento, proponemos un modelo de hablante que acomoda la presencia de emociones en los segmentos de habla al extraer una representación compacta del hablante. El modelo de hablante se estima siguiendo un procedimiento similar a la técnica i-vector, pero considera el efecto emocional como el componente de variabilidad del canal. Hemos nombrado a este método como análisis de variabilidad emocional (EVA). EVA representa el subespacio emocional por separado al subespacio del hablante, al igual que el modelo de análisis de factores conjuntos (JFA). La efectividad del sistema propuesto se evalúa comparándolo con el sistema i-vector estándar en la tarea de verificación del hablante del conjunto de datos Speech Under Simulated and Actual Stress (SUSAS) con tres métodos de puntuación diferentes. La evaluación se centra en términos de la tasa de error igual (EER). Además, también realizamos un estudio de ablación para un análisis más completo del i-vector basado en EVA. Según los resultados experimentales, el sistema propuesto superó al sistema i-vector estándar y logró resultados de vanguardia en la tarea de verificación para los hablantes con bajo estrés.
Descripción
Las condiciones emocionales causan cambios en el sistema de producción del habla. Produce diferencias en las características acústicas en comparación con condiciones neutrales. La presencia de emoción hace que el rendimiento de un sistema de verificación de hablantes se degrade. En este documento, proponemos un modelo de hablante que acomoda la presencia de emociones en los segmentos de habla al extraer una representación compacta del hablante. El modelo de hablante se estima siguiendo un procedimiento similar a la técnica i-vector, pero considera el efecto emocional como el componente de variabilidad del canal. Hemos nombrado a este método como análisis de variabilidad emocional (EVA). EVA representa el subespacio emocional por separado al subespacio del hablante, al igual que el modelo de análisis de factores conjuntos (JFA). La efectividad del sistema propuesto se evalúa comparándolo con el sistema i-vector estándar en la tarea de verificación del hablante del conjunto de datos Speech Under Simulated and Actual Stress (SUSAS) con tres métodos de puntuación diferentes. La evaluación se centra en términos de la tasa de error igual (EER). Además, también realizamos un estudio de ablación para un análisis más completo del i-vector basado en EVA. Según los resultados experimentales, el sistema propuesto superó al sistema i-vector estándar y logró resultados de vanguardia en la tarea de verificación para los hablantes con bajo estrés.