logo móvil
Contáctanos

Clasificación de vehículos de emergencia utilizando características de audio temporales y espectrales combinadas con algoritmos de aprendizaje automático

Autores: Jayakumar, Dontabhaktuni; Krishnaiah, Modugu; Kollem, Sreedhar; Peddakrishna, Samineni; Chandrasekhar, Nadikatla; Thirupathi, Maturi

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Clasificación de vehículos de emergencia utilizando características de audio temporales y espectrales combinadas con algoritmos de aprendizaje automático


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Nuevo enfoque
Clasificación de vehículos de emergencia
Características de audio
Características espectrales
Algoritmos de aprendizaje automático
Aumento de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
Este estudio presenta un enfoque novedoso para la clasificación de vehículos de emergencia que aprovecha un conjunto completo de características de audio informativas para distinguir entre sirenas de ambulancias, sirenas de camiones de bomberos y ruido de tráfico. Una contribución única radica en combinar características de dominio temporal, incluido el valor eficaz de la raíz cuadrada (RMS) y la tasa de cruce por cero, para capturar las características temporales, como los cambios de energía de la señal, con características de dominio de frecuencia derivadas de la transformada de Fourier de corto tiempo (STFT). Estas incluyen el centroide espectral, el ancho de banda espectral y la caída espectral, proporcionando información sobre el contenido de frecuencia del sonido para diferenciar los patrones de sirena del ruido del tráfico. Además, se incorporan coeficientes cepstrales de Mel-frecuencia (MFCC) para capturar la percepción auditiva similar a la humana de la información espectral. Esta combinación captura tanto las características temporales como espectrales de las señales de audio, mejorando la capacidad del modelo para discriminar entre vehículos de emergencia y ruido del tráfico en comparación con el uso de características de un solo dominio. Una contribución significativa de este estudio es la integración de técnicas de aumento de datos que replican condiciones del mundo real, incluido el efecto Doppler y consideraciones del entorno de ruido. Este estudio investiga además la efectividad de diferentes algoritmos de aprendizaje automático aplicados a las características extraídas, realizando un análisis comparativo para determinar el clasificador más efectivo para esta tarea. Este análisis revela que la máquina de vectores de soporte (SVM) logra la mayor precisión del 99.5%, seguida por bosque aleatorio (RF) y vecinos más cercanos (KNN) con un 98.5%, mientras que AdaBoost se rezaga en un 96.0% y la memoria a corto y largo plazo (LSTM) tiene una precisión del 93%. También demostramos la efectividad de un clasificador de conjunto apilado, y utilizando estos aprendices base se logra una precisión del 99.5%. Además, este estudio realizó validación cruzada de dejar uno fuera (LOOCV) para validar los resultados, con SVM y RF logrando precisiones del 98.5%, seguidas por KNN y AdaBoost, que son del 97.0% y 90.5%. Estos hallazgos indican el rendimiento superior de técnicas avanzadas de aprendizaje automático en la clasificación de vehículos de emergencia.

Otros recursos que podrían interesarte

Temas Virtualpro