DuSAFNet: Un modelo basado en la fusión de características de múltiples caminos y atención espectral-temporal para la clasificación de audio de aves
Autores: Lu, Zhengyang; Li, Huan; Liu, Min; Lin, Yibin; Qin, Yao; Wu, Xuanyu; Xu, Nanbo; Pu, Haibo
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
DuSAFNet: Un modelo basado en la fusión de características de múltiples caminos y atención espectral-temporal para la clasificación de audio de aves
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Poblaciones de aves
Salud del ecosistema
Métodos de encuesta
DuSAFNet
Modelo de aprendizaje profundo
Monitoreo acústico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
Las poblaciones de aves sirven como indicadores vitales de la salud del ecosistema, sin embargo, los métodos de encuesta tradicionales, ya sea escuchando con el oído o utilizando detectores automáticos simples, son laboriosos, propensos a errores y tienen dificultades en entornos ruidosos. En este trabajo, esta investigación presenta DuSAFNet, un modelo de aprendizaje profundo que aprovecha la fusión de características de múltiples caminos y la atención espectral-temporal para reconocer automáticamente 18 especies de aves comunes a partir de clips de audio de tres segundos con más del 96% de precisión. Al superar las limitaciones de los enfoques de características únicas y operar de manera robusta bajo ruido del mundo real, nuestro método permite un monitoreo acústico rápido y a gran escala para apoyar evaluaciones de población, gestión de hábitats y planificación de conservación.
Descripción
Las poblaciones de aves sirven como indicadores vitales de la salud del ecosistema, sin embargo, los métodos de encuesta tradicionales, ya sea escuchando con el oído o utilizando detectores automáticos simples, son laboriosos, propensos a errores y tienen dificultades en entornos ruidosos. En este trabajo, esta investigación presenta DuSAFNet, un modelo de aprendizaje profundo que aprovecha la fusión de características de múltiples caminos y la atención espectral-temporal para reconocer automáticamente 18 especies de aves comunes a partir de clips de audio de tres segundos con más del 96% de precisión. Al superar las limitaciones de los enfoques de características únicas y operar de manera robusta bajo ruido del mundo real, nuestro método permite un monitoreo acústico rápido y a gran escala para apoyar evaluaciones de población, gestión de hábitats y planificación de conservación.