Mejora del rendimiento de la localización y clasificación de vehículos y humanos mediante redes de la familia YOLO en imágenes de UAV ruidosas
Autores: Makarichev, Viktor; Tsekhmystro, Rostyslav; Lukin, Vladimir; Krytskyi, Dmytro
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Mejora del rendimiento de la localización y clasificación de vehículos y humanos mediante redes de la familia YOLO en imágenes de UAV ruidosas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Tareas
Desarrollo de ciudades inteligentes
Sensores UAV
Ruido
Redes neuronales de la familia YOLO
Eliminación de ruido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Muchas tareas importantes en el desarrollo y gestión de ciudades inteligentes se resuelven mediante sistemas de monitoreo y control instalados a bordo de vehículos aéreos no tripulados (VANT). Los sensores de los VANT pueden ser imperfectos o pueden operar en condiciones desfavorables, lo que puede resultar en la obtención de imágenes o secuencias de video que son ruidosas. El ruido puede degradar el rendimiento de los métodos de localización y clasificación de vehículos y humanos. Por lo tanto, se deben aplicar técnicas específicas para mejorar el rendimiento. En este artículo, consideramos las redes neuronales de la familia YOLO como herramientas para resolver las tareas mencionadas. Esta familia de redes se está desarrollando rápidamente; sin embargo, los datos de entrada aún pueden requerir preprocesamiento. Una opción es aplicar eliminación de ruido antes de la localización y clasificación de objetos. Además, también se pueden utilizar enfoques basados en aumento y entrenamiento. Consideramos el rendimiento de estos enfoques para varias intensidades de ruido. Identificamos los niveles de ruido en los que el rendimiento de la red comienza a degradarse y analizamos las posibilidades de mejora del rendimiento para dos filtros: BM3D y DRUNet. Ambos mejoran criterios de rendimiento como la puntuación F1, la Intersección sobre Unión y la media de Precisión Promedio. Se utilizan conjuntos de datos de áreas urbanas en el entrenamiento y verificación de la red.
Descripción
Muchas tareas importantes en el desarrollo y gestión de ciudades inteligentes se resuelven mediante sistemas de monitoreo y control instalados a bordo de vehículos aéreos no tripulados (VANT). Los sensores de los VANT pueden ser imperfectos o pueden operar en condiciones desfavorables, lo que puede resultar en la obtención de imágenes o secuencias de video que son ruidosas. El ruido puede degradar el rendimiento de los métodos de localización y clasificación de vehículos y humanos. Por lo tanto, se deben aplicar técnicas específicas para mejorar el rendimiento. En este artículo, consideramos las redes neuronales de la familia YOLO como herramientas para resolver las tareas mencionadas. Esta familia de redes se está desarrollando rápidamente; sin embargo, los datos de entrada aún pueden requerir preprocesamiento. Una opción es aplicar eliminación de ruido antes de la localización y clasificación de objetos. Además, también se pueden utilizar enfoques basados en aumento y entrenamiento. Consideramos el rendimiento de estos enfoques para varias intensidades de ruido. Identificamos los niveles de ruido en los que el rendimiento de la red comienza a degradarse y analizamos las posibilidades de mejora del rendimiento para dos filtros: BM3D y DRUNet. Ambos mejoran criterios de rendimiento como la puntuación F1, la Intersección sobre Unión y la media de Precisión Promedio. Se utilizan conjuntos de datos de áreas urbanas en el entrenamiento y verificación de la red.