logo móvil
Contáctanos

Un enfoque distribuido para el problema de conteo de hablantes en un escenario de conjunto abierto mediante la agrupación de características de tono

Autores: Pandey, Sakshi; Banerjee, Amit

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Un enfoque distribuido para el problema de conteo de hablantes en un escenario de conjunto abierto mediante la agrupación de características de tono


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Muestra de audio
Problema de conteo de altavoces
Enfoques de aprendizaje automático
Aprendizaje no supervisado
Técnicas de procesamiento de audio
Parámetros estadísticos de tono

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Contar el número de hablantes en una muestra de audio puede dar lugar a aplicaciones innovadoras, como un sistema de clasificación en tiempo real. Los investigadores han estudiado enfoques avanzados de aprendizaje automático para resolver el problema del conteo de hablantes. Sin embargo, estas soluciones no son eficientes en entornos en tiempo real, ya que requieren el preprocesamiento de un conjunto finito de muestras de datos. Otro enfoque para resolver el problema es a través del aprendizaje no supervisado o utilizando técnicas de procesamiento de audio. La investigación en esta categoría es limitada y no considera el entorno de conjunto abierto a gran escala. En este artículo, proponemos un enfoque de agrupamiento distribuido para abordar el problema del conteo de hablantes. La separabilidad del hablante se calcula utilizando parámetros estadísticos de tono. La solución propuesta utiliza múltiples micrófonos disponibles en teléfonos inteligentes en una amplia área geográfica para capturar y extraer características estadísticas de tono de las muestras de audio. Estas características se comparten entre los nodos para estimar el número de hablantes en el vecindario. Uno de los principales desafíos es reducir el conteo de errores que surge debido a la proximidad de los usuarios y múltiples micrófonos. Evaluamos el rendimiento del algoritmo utilizando teléfonos inteligentes reales en una disposición de múltiples grupos al capturar conversaciones paralelas entre los usuarios en escenarios tanto interiores como exteriores. La distancia promedio del conteo de errores es de 1.667 en un escenario de múltiples grupos. Las distancias promedio del conteo de errores en entornos interiores son del 16%, lo que es mejor que en el entorno exterior.

Otros recursos que podrían interesarte

Temas Virtualpro