Eficiente en energía basado en gráficos aprendizaje híbrido para el reconocimiento de emociones en el habla en robot humanoide
Autores: Wu, Haowen; Xu, Hanyue; Seng, Kah Phooi; Chen, Jieli; Ang, Li Minn
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Eficiente en energía basado en gráficos aprendizaje híbrido para el reconocimiento de emociones en el habla en robot humanoide
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Novela
Aprendizaje profundo basado en grafos
Reconocimiento de emociones en el habla
Robots humanoides
Implementación eficiente de energía
Red de convolución de grafos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Este documento presenta una novedosa técnica de aprendizaje profundo basada en grafos para el reconocimiento de emociones en el habla, específicamente diseñada para una implementación eficiente en términos de energía en robots humanoides. Nuestra metodología representa una fusión de representaciones de grafos escalables, fundamentadas en los principios básicos de las teorías de procesamiento de señales de grafos. Sumergiéndonos en la utilización de grafos cíclicos o lineales como constituyentes fundamentales que dan forma a una robusta arquitectura basada en Redes de Convolución de Grafos (GCN), proponemos un enfoque que permite capturar las relaciones entre las señales de habla para descodificar patrones emocionales y respuestas intrincadas. Nuestra metodología se valida y se compara con bases de datos establecidas como IEMOCAP y MSP-IMPROV. Nuestro modelo supera a los GCNs estándar y a las arquitecturas de grafos profundas prevalentes, demostrando niveles de rendimiento que se alinean con metodologías de vanguardia. Notablemente, nuestro modelo logra este logro al reducir significativamente el número de parámetros aprendibles, aumentando así la eficiencia computacional y fortaleciendo su idoneidad para entornos con recursos limitados. Esta propuesta metodología de aprendizaje híbrido basada en grafos eficiente energéticamente se aplica al reconocimiento de emociones multimodales en robots humanoides. Su capacidad para ofrecer un rendimiento competitivo al mismo tiempo que simplifica la complejidad computacional y la eficiencia energética representa un enfoque novedoso en los sistemas de reconocimiento de emociones en evolución, atendiendo a diversas aplicaciones del mundo real donde la precisión en el reconocimiento de emociones en robots humanoides es un requisito fundamental.
Descripción
Este documento presenta una novedosa técnica de aprendizaje profundo basada en grafos para el reconocimiento de emociones en el habla, específicamente diseñada para una implementación eficiente en términos de energía en robots humanoides. Nuestra metodología representa una fusión de representaciones de grafos escalables, fundamentadas en los principios básicos de las teorías de procesamiento de señales de grafos. Sumergiéndonos en la utilización de grafos cíclicos o lineales como constituyentes fundamentales que dan forma a una robusta arquitectura basada en Redes de Convolución de Grafos (GCN), proponemos un enfoque que permite capturar las relaciones entre las señales de habla para descodificar patrones emocionales y respuestas intrincadas. Nuestra metodología se valida y se compara con bases de datos establecidas como IEMOCAP y MSP-IMPROV. Nuestro modelo supera a los GCNs estándar y a las arquitecturas de grafos profundas prevalentes, demostrando niveles de rendimiento que se alinean con metodologías de vanguardia. Notablemente, nuestro modelo logra este logro al reducir significativamente el número de parámetros aprendibles, aumentando así la eficiencia computacional y fortaleciendo su idoneidad para entornos con recursos limitados. Esta propuesta metodología de aprendizaje híbrido basada en grafos eficiente energéticamente se aplica al reconocimiento de emociones multimodales en robots humanoides. Su capacidad para ofrecer un rendimiento competitivo al mismo tiempo que simplifica la complejidad computacional y la eficiencia energética representa un enfoque novedoso en los sistemas de reconocimiento de emociones en evolución, atendiendo a diversas aplicaciones del mundo real donde la precisión en el reconocimiento de emociones en robots humanoides es un requisito fundamental.