logo móvil
Contáctanos

Red de Contracción Residual Profunda Mejorada Basada en Voz para el Reconocimiento en la Industria Eléctrica

Autores: Zhang, Qingrui; Zhai, Hongting; Ma, Yuanyuan; Sun, Lili; Zhang, Yantong; Quan, Weihong; Zhai, Qi; He, Bangwei; Bai, Zhiquan

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Red de Contracción Residual Profunda Mejorada Basada en Voz para el Reconocimiento en la Industria Eléctrica


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Reconocimiento de voz
Aprendizaje profundo
Industria eléctrica
Interferencia de ruido
Red de contracción residual profunda
Mecanismo de atención de bloque convolucional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 37

Citaciones: Sin citaciones


Descripción
El reconocimiento de voz puede extraer características de voz e identificar al hablante a través de la información de voz, lo que tiene grandes perspectivas de aplicación en la verificación de identidad del personal y en el despacho de voz en la industria eléctrica. Los algoritmos tradicionales de reconocimiento de voz funcionan bien en un entorno tranquilo. Sin embargo, la interferencia de ruido inevitablemente existe en la industria eléctrica, degradando la precisión de los algoritmos tradicionales de reconocimiento de voz. En este documento, proponemos un reconocimiento de voz basado en la red de contracción residual profunda mejorada (EDRSN) mediante la combinación de los algoritmos tradicionales de reconocimiento de voz con aprendizaje profundo (DL) en el contexto del entorno ruidoso de la industria eléctrica, donde se emplea una red convolucional recurrente de doble camino (DPCRN) para reducir el ruido, y su estructura también se mejora basándose en la red de contracción residual profunda (DRSN). Además, utilizamos un módulo de mecanismo de atención de bloque convolucional (CBAM) y una convolución dilatada híbrida (HDC) en el EDRSN propuesto. Los resultados de la simulación muestran que la red propuesta puede mejorar las características vocales del hablante y distinguir y eliminar aún más las características de ruido, reduciendo así la influencia del ruido y logrando un mejor rendimiento de reconocimiento en un entorno eléctrico ruidoso.

Otros recursos que podrían interesarte

Temas Virtualpro