logo móvil
Contáctanos

Reconocimiento de Conjuntos Abiertos de Sonidos Ambientales Basado en KDE-GAN y Aprendizaje de Puntos Atractores-Recíprocos

Autores: Wu, Jiakuan; Wang, Nan; Hong, Huajie; Wang, Wei; Xing, Kunsheng; Jiang, Yujie

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Reconocimiento de Conjuntos Abiertos de Sonidos Ambientales Basado en KDE-GAN y Aprendizaje de Puntos Atractores-Recíprocos


Categoría

Artes

Subcategoría

Música

Palabras clave

Reconocimiento de conjunto abierto
Análisis de sonido ambiental
Red generativa adversarial basada en estimación de densidad de núcleo
Aprendizaje de punto recíproco de atractor
Aumento de datos
Categorías de sonido desconocidas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 39

Citaciones: Sin citaciones


Descripción
Aunque los algoritmos de reconocimiento de conjuntos abiertos se han explorado extensamente en la visión por computadora, su aplicación al análisis de sonidos ambientales sigue siendo poco estudiada. Para abordar esta brecha, este estudio investiga cómo reconocer de manera efectiva categorías de sonido desconocidas en entornos del mundo real, proponiendo una nueva Red Generativa Adversarial basada en Estimación de Densidad de Núcleo (KDE-GAN) para la augmentación de datos combinada con Aprendizaje de Puntos Recíprocos de Atractor para la clasificación de conjuntos abiertos. Específicamente, nuestro enfoque aborda tres desafíos clave: (1) Cómo generar muestras sintéticas conscientes de los límites para un entrenamiento robusto de conjuntos abiertos: Las salidas de la capa pre-logit de un clasificador de conjunto cerrado se alimentan al KDE-GAN, que sintetiza muestras mapeadas a la capa logit utilizando los pesos originales del clasificador. La Estimación de Densidad de Núcleo luego impone Pérdida de Densidad y Pérdida de Desplazamiento para asegurar que estas muestras se alineen con los límites de clase. (2) Cómo optimizar la organización del espacio de características: El clasificador de conjunto cerrado está restringido por una pérdida conjunta de Puntos Recíprocos de Atractor, manteniendo la compacidad intra-clase mientras empuja las muestras desconocidas hacia regiones de baja densidad. (3) Cómo evaluar el rendimiento en escenarios altamente abiertos: Validamos el método utilizando UrbanSound8K, AudioEventDataset y TUT Acoustic Scenes 2017 como conjuntos cerrados, con categorías de ESC-50 como muestras de conjunto abierto, logrando puntuaciones de AUROC/OSCR de 0.9251/0.8743, 0.7921/0.7135 y 0.8209/0.6262, respectivamente. Los hallazgos demuestran el potencial de este marco para mejorar los sistemas de monitoreo de sonidos ambientales, particularmente en aplicaciones que requieren adaptabilidad a eventos acústicos no vistos (por ejemplo, vigilancia de ruido urbano o monitoreo de vida silvestre).

Otros recursos que podrían interesarte

Temas Virtualpro