Red de Contracción Residual Profunda Mejorada Basada en Voz para el Reconocimiento en la Industria Eléctrica

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Red de Contracción Residual Profunda Mejorada Basada en Voz para el Reconocimiento en la Industria Eléctrica

Autores: Zhang, Qingrui; Zhai, Hongting; Ma, Yuanyuan; Sun, Lili; Zhang, Yantong; Quan, Weihong; Zhai, Qi; He, Bangwei; Bai, Zhiquan

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Red de Contracción Residual Profunda Mejorada Basada en Voz para el Reconocimiento en la Industria Eléctrica

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Reconocimiento de voz

Aprendizaje profundo

Industria eléctrica

Interferencia de ruido

Red de contracción residual profunda

Mecanismo de atención de bloque convolucional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 37

Citaciones: Sin citaciones

El reconocimiento de voz puede extraer características de voz e identificar al hablante a través de la información de voz, lo que tiene grandes perspectivas de aplicación en la verificación de identidad del personal y en el despacho de voz en la industria eléctrica. Los algoritmos tradicionales de reconocimiento de voz funcionan bien en un entorno tranquilo. Sin embargo, la interferencia de ruido inevitablemente existe en la industria eléctrica, degradando la precisión de los algoritmos tradicionales de reconocimiento de voz. En este documento, proponemos un reconocimiento de voz basado en la red de contracción residual profunda mejorada (EDRSN) mediante la combinación de los algoritmos tradicionales de reconocimiento de voz con aprendizaje profundo (DL) en el contexto del entorno ruidoso de la industria eléctrica, donde se emplea una red convolucional recurrente de doble camino (DPCRN) para reducir el ruido, y su estructura también se mejora basándose en la red de contracción residual profunda (DRSN). Además, utilizamos un módulo de mecanismo de atención de bloque convolucional (CBAM) y una convolución dilatada híbrida (HDC) en el EDRSN propuesto. Los resultados de la simulación muestran que la red propuesta puede mejorar las características vocales del hablante y distinguir y eliminar aún más las características de ruido, reduciendo así la influencia del ruido y logrando un mejor rendimiento de reconocimiento en un entorno eléctrico ruidoso.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro