UAV-YOLO12: Un modelo de segmentación de carreteras a múltiples escalas para imágenes de teledetección de UAV
Autores: Cui, Bingyan; Liu, Zhen; Yang, Qifeng
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
UAV-YOLO12: Un modelo de segmentación de carreteras a múltiples escalas para imágenes de teledetección de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículos aéreos no tripulados
Inspección de infraestructura vial
Modelo de segmentación
UAV-YOLOv12
Red de Núcleo Selectivo
Convolución Parcial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los vehículos aéreos no tripulados (VANT) se utilizan cada vez más para la inspección y monitoreo de infraestructuras viales. Sin embargo, desafíos como la variación de escala, la interferencia de fondos complejos y la escasez de conjuntos de datos anotados de VANT limitan el rendimiento de los modelos de segmentación tradicionales. Para abordar estos desafíos, este estudio propone UAV-YOLOv12, un modelo de segmentación multiescala diseñado específicamente para el análisis de imágenes de carreteras basadas en VANT. El modelo propuesto se basa en la arquitectura YOLOv12 al agregar dos módulos clave. Utiliza una Red de Núcleo Selectivo (SKNet) para ajustar dinámicamente los campos receptivos y un módulo de Convolución Parcial (PConv) para mejorar el enfoque espacial y la robustez en regiones ocluidas. Estas mejoras ayudan al modelo a detectar mejor características viales pequeñas e irregulares en escenas aéreas complejas. Los resultados experimentales en un conjunto de datos personalizado de VANT recopilado de carreteras nacionales en Wuxi, China, muestran que UAV-YOLOv12 logra puntuaciones F1 de 0.902 para carreteras (road-H) y 0.825 para caminos (road-P), superando al YOLOv12 original en un 5% y un 3.2%, respectivamente. La velocidad de inferencia se mantiene en 11.1 ms por imagen, apoyando un rendimiento casi en tiempo real. Además, las evaluaciones comparativas con U-Net muestran que UAV-YOLOv12 mejora en un 7.1% y un 9.5%. El modelo también exhibe una fuerte capacidad de generalización, logrando puntuaciones F1 superiores a 0.87 en conjuntos de datos públicos como VHR-10 y el conjunto de datos de vehículos de drones. Estos resultados demuestran que el UAV-YOLOv12 propuesto puede lograr alta precisión y robustez en diversos entornos viales y escalas de objetos.
Descripción
Los vehículos aéreos no tripulados (VANT) se utilizan cada vez más para la inspección y monitoreo de infraestructuras viales. Sin embargo, desafíos como la variación de escala, la interferencia de fondos complejos y la escasez de conjuntos de datos anotados de VANT limitan el rendimiento de los modelos de segmentación tradicionales. Para abordar estos desafíos, este estudio propone UAV-YOLOv12, un modelo de segmentación multiescala diseñado específicamente para el análisis de imágenes de carreteras basadas en VANT. El modelo propuesto se basa en la arquitectura YOLOv12 al agregar dos módulos clave. Utiliza una Red de Núcleo Selectivo (SKNet) para ajustar dinámicamente los campos receptivos y un módulo de Convolución Parcial (PConv) para mejorar el enfoque espacial y la robustez en regiones ocluidas. Estas mejoras ayudan al modelo a detectar mejor características viales pequeñas e irregulares en escenas aéreas complejas. Los resultados experimentales en un conjunto de datos personalizado de VANT recopilado de carreteras nacionales en Wuxi, China, muestran que UAV-YOLOv12 logra puntuaciones F1 de 0.902 para carreteras (road-H) y 0.825 para caminos (road-P), superando al YOLOv12 original en un 5% y un 3.2%, respectivamente. La velocidad de inferencia se mantiene en 11.1 ms por imagen, apoyando un rendimiento casi en tiempo real. Además, las evaluaciones comparativas con U-Net muestran que UAV-YOLOv12 mejora en un 7.1% y un 9.5%. El modelo también exhibe una fuerte capacidad de generalización, logrando puntuaciones F1 superiores a 0.87 en conjuntos de datos públicos como VHR-10 y el conjunto de datos de vehículos de drones. Estos resultados demuestran que el UAV-YOLOv12 propuesto puede lograr alta precisión y robustez en diversos entornos viales y escalas de objetos.