Reconocimiento de voz mediante impresión vocal en condiciones de escenario cruzado utilizando el modelo de red neuronal con atención eficiente en canales guiada por entropía de paquetes de ondas perceptuales-Res2Net-Time-Delay
Autores: Wang, Shuqi; Zhang, Huajun; Zhang, Xuetao; Su, Yixin; Wang, Zhenghua
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reconocimiento de voz mediante impresión vocal en condiciones de escenario cruzado utilizando el modelo de red neuronal con atención eficiente en canales guiada por entropía de paquetes de ondas perceptuales-Res2Net-Time-Delay
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tecnología de reconocimiento de voz
Aprendizaje profundo
Método PWPE
Bloque ECA
Bloque Res2Net
Reconocimiento de locutor
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
(1) La tecnología de reconocimiento de voz utiliza características vocales individuales para la autenticación de identidad y enfrenta muchos desafíos en aplicaciones entre escenarios. El entorno sonoro, las características del dispositivo y las condiciones de grabación en diferentes escenarios causan cambios en las características del sonido, lo que a su vez afecta la precisión del reconocimiento de voz.
Descripción
(1) La tecnología de reconocimiento de voz utiliza características vocales individuales para la autenticación de identidad y enfrenta muchos desafíos en aplicaciones entre escenarios. El entorno sonoro, las características del dispositivo y las condiciones de grabación en diferentes escenarios causan cambios en las características del sonido, lo que a su vez afecta la precisión del reconocimiento de voz.