AVD-YOLO: Extracción de características multi-escala impulsada por visión activa para una detección mejorada de anomalías en la carretera
Autores: Jin, Minhong; Zhu, Zhongjie; Tu, Renwei; Lv, Ang; Yu, Zhijing
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
AVD-YOLO: Extracción de características multi-escala impulsada por visión activa para una detección mejorada de anomalías en la carretera
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Deficiencias
Sistemas de detección de anomalías en carreteras
Probabilidades de colisión
Eficiencia del flujo de tráfico
Costos de mantenimiento
AVD-YOLO
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las deficiencias en los sistemas de detección de anomalías en carreteras precipitan riesgos multifacéticos, incluyendo probabilidades elevadas de colisiones debido a peligros no identificados, eficiencia comprometida del flujo de tráfico y costos de mantenimiento exponenciales. Los métodos contemporáneos luchan con entornos viales complejos, perspectivas de visualización dinámicas y conjuntos de datos limitados. Presentamos AVD-YOLO, una variante mejorada de YOLO que integra sinérgicamente la extracción de características multi-escala impulsada por visión activa (AVD) con mecanismos de atención modulada por posición (PMA). PMA aborda la disminución de la discriminabilidad entre el objetivo y el fondo bajo condiciones de iluminación y clima variables al capturar dependencias espaciales de largo alcance, mejorando la detección de objetivos con características débiles. La técnica AVD mitiga las detecciones perdidas causadas por variaciones en la distancia de visualización en tiempo real a través de mecanismos adaptativos de campo receptivo múltiple, manteniendo la fijación conceptual del objetivo mientras ajusta dinámicamente las escalas de características. Para abordar la escasez de datos, se construyó un conjunto de datos integral de anomalías en carreteras de múltiples clases (MCRAD) que comprende 14,208 imágenes anotadas en nueve categorías de anomalías. Los experimentos demuestran que AVD-YOLO mejora la precisión de detección, logrando una ganancia del 1.6% en mAP@0.5 y una mejora del 2.9% en la puntuación F1 en comparación con la línea base. Estas mejoras en el rendimiento indican tanto una localización más precisa de objetos anormales como un mejor equilibrio entre precisión y recuperación, mejorando así la robustez general del modelo de detección.
Descripción
Las deficiencias en los sistemas de detección de anomalías en carreteras precipitan riesgos multifacéticos, incluyendo probabilidades elevadas de colisiones debido a peligros no identificados, eficiencia comprometida del flujo de tráfico y costos de mantenimiento exponenciales. Los métodos contemporáneos luchan con entornos viales complejos, perspectivas de visualización dinámicas y conjuntos de datos limitados. Presentamos AVD-YOLO, una variante mejorada de YOLO que integra sinérgicamente la extracción de características multi-escala impulsada por visión activa (AVD) con mecanismos de atención modulada por posición (PMA). PMA aborda la disminución de la discriminabilidad entre el objetivo y el fondo bajo condiciones de iluminación y clima variables al capturar dependencias espaciales de largo alcance, mejorando la detección de objetivos con características débiles. La técnica AVD mitiga las detecciones perdidas causadas por variaciones en la distancia de visualización en tiempo real a través de mecanismos adaptativos de campo receptivo múltiple, manteniendo la fijación conceptual del objetivo mientras ajusta dinámicamente las escalas de características. Para abordar la escasez de datos, se construyó un conjunto de datos integral de anomalías en carreteras de múltiples clases (MCRAD) que comprende 14,208 imágenes anotadas en nueve categorías de anomalías. Los experimentos demuestran que AVD-YOLO mejora la precisión de detección, logrando una ganancia del 1.6% en mAP@0.5 y una mejora del 2.9% en la puntuación F1 en comparación con la línea base. Estas mejoras en el rendimiento indican tanto una localización más precisa de objetos anormales como un mejor equilibrio entre precisión y recuperación, mejorando así la robustez general del modelo de detección.