Implícitamente alineando distribuciones conjuntas para el reconocimiento de emociones en el habla entre corpus
Autores: Lu, Cheng; Zong, Yuan; Tang, Chuangao; Lian, Hailun; Chang, Hongli; Zhu, Jie; Li, Sunan; Zhao, Yan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Implícitamente alineando distribuciones conjuntas para el reconocimiento de emociones en el habla entre corpus
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Propuesto
Reconocimiento de emociones en el habla entre corpus
JIASL
Alineación de distribución
Modelo de regresión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
En este trabajo, investigamos el problema del reconocimiento de emociones en el habla entre corpus cruzados (SER), en el que las muestras de habla de entrenamiento (fuente) y de prueba (objetivo) pertenecen a corpora diferentes. Este caso conduce a una falta de coincidencia en la distribución de características entre las muestras de habla de la fuente y del objetivo. Por lo tanto, el rendimiento de la mayoría de los métodos existentes de SER disminuye bruscamente. Para resolver este problema, proponemos un método de aprendizaje de subespacio de transferencia simple pero efectivo llamado aprendizaje de subespacio alineado implícitamente con distribución conjunta (JIASL). La idea básica de JIASL es muy directa, es decir, construir un modelo de regresión lineal discriminativo de emociones e invariante de corpus bajo una estrategia de alineación de distribución implícita. Siguiendo esta idea, primero utilizamos las características de habla de la fuente y las etiquetas de emociones para dotar a dicho modelo de regresión con la capacidad de discriminación de emociones. Luego, se adopta un término de regularización de reconstrucción bien diseñado, que considera conjuntamente las alineaciones de distribución marginal y condicional entre las muestras de habla en ambos corpora, para permitir implícitamente que el modelo de regresión prediga las etiquetas de emociones de las muestras de habla objetivo. Para evaluar el rendimiento de nuestro propuesto JIASL, se realizan extensos experimentos de SER entre corpus cruzados, y los resultados demuestran el rendimiento prometedor del propuesto JIASL en hacer frente a las tareas de SER entre corpus cruzados.
Descripción
En este trabajo, investigamos el problema del reconocimiento de emociones en el habla entre corpus cruzados (SER), en el que las muestras de habla de entrenamiento (fuente) y de prueba (objetivo) pertenecen a corpora diferentes. Este caso conduce a una falta de coincidencia en la distribución de características entre las muestras de habla de la fuente y del objetivo. Por lo tanto, el rendimiento de la mayoría de los métodos existentes de SER disminuye bruscamente. Para resolver este problema, proponemos un método de aprendizaje de subespacio de transferencia simple pero efectivo llamado aprendizaje de subespacio alineado implícitamente con distribución conjunta (JIASL). La idea básica de JIASL es muy directa, es decir, construir un modelo de regresión lineal discriminativo de emociones e invariante de corpus bajo una estrategia de alineación de distribución implícita. Siguiendo esta idea, primero utilizamos las características de habla de la fuente y las etiquetas de emociones para dotar a dicho modelo de regresión con la capacidad de discriminación de emociones. Luego, se adopta un término de regularización de reconstrucción bien diseñado, que considera conjuntamente las alineaciones de distribución marginal y condicional entre las muestras de habla en ambos corpora, para permitir implícitamente que el modelo de regresión prediga las etiquetas de emociones de las muestras de habla objetivo. Para evaluar el rendimiento de nuestro propuesto JIASL, se realizan extensos experimentos de SER entre corpus cruzados, y los resultados demuestran el rendimiento prometedor del propuesto JIASL en hacer frente a las tareas de SER entre corpus cruzados.