Extracción de huellas dactilares de audio basada en incrustación lineal local para sistema de recuperación de audio
Autores: Jia, Maoshen; Li, Tianhao; Wang, Jing
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Extracción de huellas dactilares de audio basada en incrustación lineal local para sistema de recuperación de audio
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Recuperación de audio
Recuperación de huella dactilar de audio
Incrustación lineal local
Método de huella dactilar de audio
Alineación dinámica temporal
Dominio de frecuencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 59
Citaciones: Sin citaciones
Con la aparición de una gran cantidad de datos de audio, las personas tienen una mayor demanda de recuperación de audio, que puede encontrar rápidamente y de manera precisa la información requerida. La recuperación de huellas digitales de audio es una opción popular debido a su excelente rendimiento. Sin embargo, existe un problema con la gran cantidad de datos de huellas digitales de audio en el método de recuperación de huellas digitales de audio existente, que ocupa más espacio de almacenamiento y afecta la velocidad de recuperación. Con el objetivo de abordar el problema, este documento presenta un nuevo método de huellas digitales de audio basado en la incrustación lineal local (LLE) que tiene huellas digitales más pequeñas y una recuperación más eficiente. La extracción de huellas digitales de audio propuesta divide las bandas alrededor de cada pico en el dominio de frecuencia en cuatro grupos de subregiones y se calcula la energía de cada subregión. Luego, se realiza el LLE para cada grupo, respectivamente, y la huella digital de audio se codifica comparando las energías adyacentes. Para resolver la distorsión de los cambios de velocidad lineales, se adopta una estrategia de coincidencia basada en el alineamiento temporal dinámico (DTW) en la parte de recuperación, que puede comparar dos segmentos de audio con longitudes diferentes. Para evaluar el rendimiento de recuperación del método propuesto, se realizan experimentos bajo diferentes condiciones de reducción de dimensionalidad de grupos únicos y múltiples. Ambos pueden lograr una alta tasa de recuperación y precisión y tienen una mejor eficiencia de recuperación con menos datos en comparación con algunos métodos de vanguardia.
Descripción
Con la aparición de una gran cantidad de datos de audio, las personas tienen una mayor demanda de recuperación de audio, que puede encontrar rápidamente y de manera precisa la información requerida. La recuperación de huellas digitales de audio es una opción popular debido a su excelente rendimiento. Sin embargo, existe un problema con la gran cantidad de datos de huellas digitales de audio en el método de recuperación de huellas digitales de audio existente, que ocupa más espacio de almacenamiento y afecta la velocidad de recuperación. Con el objetivo de abordar el problema, este documento presenta un nuevo método de huellas digitales de audio basado en la incrustación lineal local (LLE) que tiene huellas digitales más pequeñas y una recuperación más eficiente. La extracción de huellas digitales de audio propuesta divide las bandas alrededor de cada pico en el dominio de frecuencia en cuatro grupos de subregiones y se calcula la energía de cada subregión. Luego, se realiza el LLE para cada grupo, respectivamente, y la huella digital de audio se codifica comparando las energías adyacentes. Para resolver la distorsión de los cambios de velocidad lineales, se adopta una estrategia de coincidencia basada en el alineamiento temporal dinámico (DTW) en la parte de recuperación, que puede comparar dos segmentos de audio con longitudes diferentes. Para evaluar el rendimiento de recuperación del método propuesto, se realizan experimentos bajo diferentes condiciones de reducción de dimensionalidad de grupos únicos y múltiples. Ambos pueden lograr una alta tasa de recuperación y precisión y tienen una mejor eficiencia de recuperación con menos datos en comparación con algunos métodos de vanguardia.