Sistema de detección de actividad de voz de ultra baja potencia utilizando muestreo de cruce de nivel
Autores: Faghani, Maral; Rezaee-Dehsorkh, Hamidreza; Ravanshad, Nassim; Aminzadeh, Hamed
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Sistema de detección de actividad de voz de ultra baja potencia utilizando muestreo de cruce de nivel
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ultra bajo consumo de energía
Detección de actividad de voz
Muestreo de cruce de nivel
Extracción de características
LC-ADC
Consumo de energía
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Este documento presenta un sistema de detección de actividad de voz (VAD) de ultra bajo consumo para discriminar la voz de las partes no vocales de las señales de audio. El sistema VAD propuesto utiliza muestreo de cruce de nivel para la detección de actividad vocal. Las muestras inútiles en las partes no vocales de la señal se eliminan debido a la naturaleza dependiente de la actividad de este esquema de muestreo. Una ventana móvil de 40 ms con un solapamiento de 30 ms se explota como bloque de extracción de características, dentro del cual las muestras de salida del convertidor analógico-digital de cruce de nivel (LC-ADC) se cuentan como la característica. La única variable utilizada para distinguir segmentos de voz y no voz en la señal de entrada de audio es el número de muestras de salida de LC-ADC dentro de una ventana de tiempo. El sistema propuesto logra un promedio de 91.02% de tasa de acierto de voz y 82.64% de tasa de acierto de no voz sobre 12 tipos de ruido a -5, 0, 5 y 10 dB de relación señal-ruido (SNR) sobre la base de datos TIMIT. El sistema propuesto, incluido LC-ADC, extracción de características y circuitos de clasificación, fue diseñado en tecnología CMOS de 0.18 um. Los resultados de simulación posterior al diseño muestran un consumo de energía de 394.6 nW con un área de silicio de 0.044 mm, lo que lo hace adecuado como un dispositivo siempre activo en un sistema de reconocimiento de voz automático.
Descripción
Este documento presenta un sistema de detección de actividad de voz (VAD) de ultra bajo consumo para discriminar la voz de las partes no vocales de las señales de audio. El sistema VAD propuesto utiliza muestreo de cruce de nivel para la detección de actividad vocal. Las muestras inútiles en las partes no vocales de la señal se eliminan debido a la naturaleza dependiente de la actividad de este esquema de muestreo. Una ventana móvil de 40 ms con un solapamiento de 30 ms se explota como bloque de extracción de características, dentro del cual las muestras de salida del convertidor analógico-digital de cruce de nivel (LC-ADC) se cuentan como la característica. La única variable utilizada para distinguir segmentos de voz y no voz en la señal de entrada de audio es el número de muestras de salida de LC-ADC dentro de una ventana de tiempo. El sistema propuesto logra un promedio de 91.02% de tasa de acierto de voz y 82.64% de tasa de acierto de no voz sobre 12 tipos de ruido a -5, 0, 5 y 10 dB de relación señal-ruido (SNR) sobre la base de datos TIMIT. El sistema propuesto, incluido LC-ADC, extracción de características y circuitos de clasificación, fue diseñado en tecnología CMOS de 0.18 um. Los resultados de simulación posterior al diseño muestran un consumo de energía de 394.6 nW con un área de silicio de 0.044 mm, lo que lo hace adecuado como un dispositivo siempre activo en un sistema de reconocimiento de voz automático.