logo móvil
Contáctanos

Sistema de detección de actividad de voz de ultra baja potencia utilizando muestreo de cruce de nivel

Autores: Faghani, Maral; Rezaee-Dehsorkh, Hamidreza; Ravanshad, Nassim; Aminzadeh, Hamed

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Sistema de detección de actividad de voz de ultra baja potencia utilizando muestreo de cruce de nivel


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Ultra bajo consumo de energía
Detección de actividad de voz
Muestreo de cruce de nivel
Extracción de características
LC-ADC
Consumo de energía

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 32

Citaciones: Sin citaciones


Descripción
Este documento presenta un sistema de detección de actividad de voz (VAD) de ultra bajo consumo para discriminar la voz de las partes no vocales de las señales de audio. El sistema VAD propuesto utiliza muestreo de cruce de nivel para la detección de actividad vocal. Las muestras inútiles en las partes no vocales de la señal se eliminan debido a la naturaleza dependiente de la actividad de este esquema de muestreo. Una ventana móvil de 40 ms con un solapamiento de 30 ms se explota como bloque de extracción de características, dentro del cual las muestras de salida del convertidor analógico-digital de cruce de nivel (LC-ADC) se cuentan como la característica. La única variable utilizada para distinguir segmentos de voz y no voz en la señal de entrada de audio es el número de muestras de salida de LC-ADC dentro de una ventana de tiempo. El sistema propuesto logra un promedio de 91.02% de tasa de acierto de voz y 82.64% de tasa de acierto de no voz sobre 12 tipos de ruido a -5, 0, 5 y 10 dB de relación señal-ruido (SNR) sobre la base de datos TIMIT. El sistema propuesto, incluido LC-ADC, extracción de características y circuitos de clasificación, fue diseñado en tecnología CMOS de 0.18 um. Los resultados de simulación posterior al diseño muestran un consumo de energía de 394.6 nW con un área de silicio de 0.044 mm, lo que lo hace adecuado como un dispositivo siempre activo en un sistema de reconocimiento de voz automático.

Otros recursos que podrían interesarte

Temas Virtualpro