ECAN-Detector: Una Red de Agregación de Contexto Eficiente para la Detección de Objetos Pequeños
Autores: Xing, Gaofeng; Xu, Zhikang; He, Yulong; Ning, Hailong; Sun, Menghao; Wang, Chunmei
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
ECAN-Detector: Una Red de Agregación de Contexto Eficiente para la Detección de Objetos Pequeños
Categoría
Matemáticas
Subcategoría
Matemáticas aplicadas
Palabras clave
Campo
Detección de objetos
Objetos pequeños
ECAN-Detector
Capas superficiales
Detección de objetos pequeños
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En la última década, el campo de la detección de objetos ha avanzado notablemente, especialmente en el reconocimiento preciso de objetos de tamaño mediano y grande. Sin embargo, detectar objetos pequeños sigue siendo difícil porque su apariencia de baja resolución proporciona características discriminativas insuficientes, y a menudo sufren oclusiones severas, particularmente en el contexto crítico de seguridad de la conducción autónoma. Los detectores convencionales a menudo no logran extraer suficiente información de mapas de características superficiales, lo que limita su capacidad para detectar objetos pequeños con alta precisión. Para abordar este problema, proponemos el ECAN-Detector, un método eficiente de agregación de contexto diseñado para enriquecer la representación de características de las capas superficiales, que son particularmente beneficiosas para la detección de objetos pequeños. El modelo primero emplea una capa de detección superficial adicional para extraer características de alta resolución que proporcionan información más detallada para las etapas posteriores de la red, y luego incorpora un transformador de escala dinámica (DST) que enriquece la percepción espacial al fusionar adaptativamente la semántica global y el contexto local. Concurrentemente, un módulo de aumento de contexto (CAM) incrustado en la capa superficial complementa tanto las características globales como las locales relevantes para los objetos pequeños. Para aumentar aún más la precisión promedio de la detección de objetos pequeños, implementamos un método más rápido que utiliza dos convoluciones reparametrizadas en la cabeza de detección. Finalmente, extensos experimentos realizados en los conjuntos de datos VisDrone2012-DET y VisDrone2021-DET verificaron que nuestro método propuesto supera el modelo base y logró una mejora significativa del 3.1% en AP y 3.5% en . En comparación con los detectores de última generación (SOTA) recientes, el ECAN Detector ofrece una precisión comparable y, sin embargo, mantiene un rendimiento en tiempo real, alcanzando 54.3 FPS.
Descripción
En la última década, el campo de la detección de objetos ha avanzado notablemente, especialmente en el reconocimiento preciso de objetos de tamaño mediano y grande. Sin embargo, detectar objetos pequeños sigue siendo difícil porque su apariencia de baja resolución proporciona características discriminativas insuficientes, y a menudo sufren oclusiones severas, particularmente en el contexto crítico de seguridad de la conducción autónoma. Los detectores convencionales a menudo no logran extraer suficiente información de mapas de características superficiales, lo que limita su capacidad para detectar objetos pequeños con alta precisión. Para abordar este problema, proponemos el ECAN-Detector, un método eficiente de agregación de contexto diseñado para enriquecer la representación de características de las capas superficiales, que son particularmente beneficiosas para la detección de objetos pequeños. El modelo primero emplea una capa de detección superficial adicional para extraer características de alta resolución que proporcionan información más detallada para las etapas posteriores de la red, y luego incorpora un transformador de escala dinámica (DST) que enriquece la percepción espacial al fusionar adaptativamente la semántica global y el contexto local. Concurrentemente, un módulo de aumento de contexto (CAM) incrustado en la capa superficial complementa tanto las características globales como las locales relevantes para los objetos pequeños. Para aumentar aún más la precisión promedio de la detección de objetos pequeños, implementamos un método más rápido que utiliza dos convoluciones reparametrizadas en la cabeza de detección. Finalmente, extensos experimentos realizados en los conjuntos de datos VisDrone2012-DET y VisDrone2021-DET verificaron que nuestro método propuesto supera el modelo base y logró una mejora significativa del 3.1% en AP y 3.5% en . En comparación con los detectores de última generación (SOTA) recientes, el ECAN Detector ofrece una precisión comparable y, sin embargo, mantiene un rendimiento en tiempo real, alcanzando 54.3 FPS.