RoadNet: Un marco de Transformer-CNN de alta precisión para la detección de defectos en carreteras a través de la percepción visual basada en UAV
Autores: Gou, Long; Liang, Yadong; Zhang, Xingyu; Yang, Jianfeng
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
RoadNet: Un marco de Transformer-CNN de alta precisión para la detección de defectos en carreteras a través de la percepción visual basada en UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de defectos en carreteras
Vehículos aéreos no tripulados
Aprendizaje profundo
Módulos de transformador
Red neuronal convolucional
Perspectivas de UAV
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección automatizada de defectos en carreteras utilizando vehículos aéreos no tripulados (UAV) ha surgido como una solución eficiente y segura para la inspección de infraestructuras a gran escala. Sin embargo, la detección de objetos en imágenes aéreas presenta desafíos únicos, incluyendo la prevalencia de objetivos extremadamente pequeños, fondos complejos y variaciones significativas de escala. Los modelos de detección basados en aprendizaje profundo convencionales a menudo tienen dificultades con estos problemas, mostrando limitaciones en la detección de pequeñas grietas, altas demandas computacionales y una capacidad de generalización insuficiente para las perspectivas de los UAV. Para abordar estos desafíos, este artículo propone una nueva red integral, RoadNet, diseñada específicamente para la detección de defectos en carreteras con alta precisión en imágenes capturadas por UAV. RoadNet integra de manera innovadora módulos de Transformer con una red neuronal convolucional como base y cabeza de detección. Este diseño no solo mejora significativamente la capacidad de modelado de características globales, crucial para entender contextos aéreos complejos, sino que también mantiene la eficiencia computacional necesaria para aplicaciones potenciales en tiempo real. El modelo fue entrenado y evaluado en un conjunto de datos de defectos en carreteras recopilado por UAV (UAV-RDD). En experimentos comparativos, RoadNet logró un destacado puntaje mAP@0.5 de 0.9128 mientras mantenía una velocidad de procesamiento rápida de 210.01 ms por imagen, superando a otros modelos de última generación. Los resultados experimentales demuestran que RoadNet posee un rendimiento de detección superior para defectos en carreteras en escenarios aéreos complejos capturados por drones.
Descripción
La detección automatizada de defectos en carreteras utilizando vehículos aéreos no tripulados (UAV) ha surgido como una solución eficiente y segura para la inspección de infraestructuras a gran escala. Sin embargo, la detección de objetos en imágenes aéreas presenta desafíos únicos, incluyendo la prevalencia de objetivos extremadamente pequeños, fondos complejos y variaciones significativas de escala. Los modelos de detección basados en aprendizaje profundo convencionales a menudo tienen dificultades con estos problemas, mostrando limitaciones en la detección de pequeñas grietas, altas demandas computacionales y una capacidad de generalización insuficiente para las perspectivas de los UAV. Para abordar estos desafíos, este artículo propone una nueva red integral, RoadNet, diseñada específicamente para la detección de defectos en carreteras con alta precisión en imágenes capturadas por UAV. RoadNet integra de manera innovadora módulos de Transformer con una red neuronal convolucional como base y cabeza de detección. Este diseño no solo mejora significativamente la capacidad de modelado de características globales, crucial para entender contextos aéreos complejos, sino que también mantiene la eficiencia computacional necesaria para aplicaciones potenciales en tiempo real. El modelo fue entrenado y evaluado en un conjunto de datos de defectos en carreteras recopilado por UAV (UAV-RDD). En experimentos comparativos, RoadNet logró un destacado puntaje mAP@0.5 de 0.9128 mientras mantenía una velocidad de procesamiento rápida de 210.01 ms por imagen, superando a otros modelos de última generación. Los resultados experimentales demuestran que RoadNet posee un rendimiento de detección superior para defectos en carreteras en escenarios aéreos complejos capturados por drones.