logo móvil
Contáctanos

SincNet-based identificación de hablantes para entornos robóticos con distancia de interacción humano-robot variable

Autores: Kim, Seo-Hyun; Jo, A-Hyeon; Kwak, Keun-Chang

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

SincNet-based identificación de hablantes para entornos robóticos con distancia de interacción humano-robot variable


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Interacción humano-robot
Reconocimiento de hablantes
Datos coreanos
Entornos robóticos
Modelo de aprendizaje profundo
SincNet

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 21

Citaciones: Sin citaciones


Descripción
A medida que la interacción humano-robot (HRI) se vuelve cada vez más significativa, varios estudios se han centrado en el reconocimiento de hablantes. Sin embargo, pocos estudios han explorado este tema en el entorno específico de los robots de servicio doméstico. Especialmente, la mayoría de las investigaciones existentes se basan en bases de datos compuestas por datos en inglés, mientras que los estudios que utilizan datos de habla en coreano son sumamente escasos. Esta brecha subraya la necesidad de investigar el reconocimiento de hablantes en entornos robóticos, específicamente utilizando datos en coreano. En respuesta, este artículo realiza experimentos utilizando una base de datos de reconocimiento de hablantes adaptada al idioma coreano y establecida en un contexto robótico. La base de datos incluye ruido generado por el movimiento del robot, así como ruido ambiental común, teniendo en cuenta las distancias variables entre humanos y robots, que se dividen en consecuencia. El modelo de aprendizaje profundo utilizado es SincNet, con experimentos realizados bajo dos configuraciones para los parámetros del filtro SincNet: uno con parámetros aprendibles y otro con valores fijos. Después de entrenar el modelo con datos recopilados a distancias variables, se probó el rendimiento en estas distancias. Los resultados experimentales indican que SincNet con parámetros aprendibles logró una precisión máxima del 99%.

Otros recursos que podrían interesarte

Temas Virtualpro