Reconocimiento automático de escenas a través de clasificación acústica para robótica conductual
Autores: Aziz, Sumair; Awais, Muhammad; Akram, Tallha; Khan, Umar; Alhussein, Musaed; Aurangzeb, Khursheed
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Reconocimiento automático de escenas a través de clasificación acústica para robótica conductual
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación
Escenas acústicas
Aprendizaje automático
Paisajes sonoros
Descriptor de características
Máquina de vectores de soporte
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
La clasificación de escenas acústicas complejas en escenarios en tiempo real es un dominio activo que ha involucrado a varios investigadores recientemente de la comunidad de aprendizaje automático. Se han propuesto una variedad de técnicas para la clasificación de patrones acústicos o escenas, incluyendo paisajes sonoros naturales como la lluvia/truenos y paisajes sonoros urbanos como restaurantes/calles, etc. En este trabajo, presentamos un marco para la clasificación acústica automática para la robótica conductual. Motivado por varios algoritmos de clasificación de texturas utilizados en visión por computadora, se propone un descriptor de características modificado para el sonido que incorpora una combinación de patrones ternarios locales de 1-D (1D-LTP) y el método base de coeficientes cepstrales de mel-frecuencia (MFCC). El vector de características extraído se clasifica posteriormente utilizando una máquina de vectores de soporte (SVM) multiclase, que se selecciona como clasificador base. El método propuesto se valida en dos conjuntos de datos de referencia estándar, es decir, DCASE y RWCP, y logra precisión de y , respectivamente. Un análisis comparativo demuestra que el esquema propuesto funciona excepcionalmente bien en comparación con otros descriptores de características.
Descripción
La clasificación de escenas acústicas complejas en escenarios en tiempo real es un dominio activo que ha involucrado a varios investigadores recientemente de la comunidad de aprendizaje automático. Se han propuesto una variedad de técnicas para la clasificación de patrones acústicos o escenas, incluyendo paisajes sonoros naturales como la lluvia/truenos y paisajes sonoros urbanos como restaurantes/calles, etc. En este trabajo, presentamos un marco para la clasificación acústica automática para la robótica conductual. Motivado por varios algoritmos de clasificación de texturas utilizados en visión por computadora, se propone un descriptor de características modificado para el sonido que incorpora una combinación de patrones ternarios locales de 1-D (1D-LTP) y el método base de coeficientes cepstrales de mel-frecuencia (MFCC). El vector de características extraído se clasifica posteriormente utilizando una máquina de vectores de soporte (SVM) multiclase, que se selecciona como clasificador base. El método propuesto se valida en dos conjuntos de datos de referencia estándar, es decir, DCASE y RWCP, y logra precisión de y , respectivamente. Un análisis comparativo demuestra que el esquema propuesto funciona excepcionalmente bien en comparación con otros descriptores de características.