Un modelo ligero de detección de objetos en tiempo real basado en YOLOv8 para vehículos aéreos no tripulados
Autores: Ding, Baolong; Zhang, Yihong; Ma, Shuai
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo ligero de detección de objetos en tiempo real basado en YOLOv8 para vehículos aéreos no tripulados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Despliegue
Modelos de detección de objetivos
Dispositivos de borde
Liviano
Detección de objetos infrarrojos en tiempo real
LRI-YOLO
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Desplegar modelos de detección de objetivos en dispositivos de borde como UAVs es un desafío debido a su tamaño limitado y capacidad computacional, mientras que los modelos de detección de objetivos suelen requerir recursos computacionales significativos. Para abordar este problema, este estudio propone un modelo ligero de detección de objetos infrarrojos en tiempo real llamado LRI-YOLO (YOLO Infrarrojo en Tiempo Real Ligero), que se basa en YOLOv8n. El modelo mejora la estructura Bottleneck del módulo C2f integrando Convolución Parcial (PConv) con Convolución Punto a Punto (PWConv), logrando un diseño más ligero. Además, durante la etapa de fusión de características, la estructura de submuestreo original con convolución ordinaria se reemplaza por una combinación de max pooling y convolución regular. Esta modificación retiene más información del mapa de características. La estructura del modelo se optimiza aún más rediseñando la cabeza de detección desacoplada con Convolución de Grupo (GConv) en lugar de convolución ordinaria, mejorando significativamente la velocidad de detección. Además, la BCELoss original se reemplaza con EMASlideLoss, una nueva función de pérdida de clasificación introducida en este estudio. Esta función de pérdida permite que el modelo se enfoque más en muestras difíciles, mejorando así su capacidad de clasificación. En comparación con el algoritmo YOLOv8n, LRI-YOLO es más ligero, con sus parámetros reducidos en un 46.7% y las operaciones de punto flotante (FLOPs) reducidas en un 53.1%. Además, la precisión media promedio (mAP) alcanzó el 94.1%. Notablemente, en dispositivos con potencia computacional moderada que solo tienen una Unidad Central de Procesamiento (CPU), la velocidad de detección alcanzó 42 fotogramas por segundo (FPS), superando la mayoría de los modelos convencionales. Esto indica que LRI-YOLO ofrece una solución novedosa para la detección de objetos infrarrojos en tiempo real en dispositivos de borde como drones.
Descripción
Desplegar modelos de detección de objetivos en dispositivos de borde como UAVs es un desafío debido a su tamaño limitado y capacidad computacional, mientras que los modelos de detección de objetivos suelen requerir recursos computacionales significativos. Para abordar este problema, este estudio propone un modelo ligero de detección de objetos infrarrojos en tiempo real llamado LRI-YOLO (YOLO Infrarrojo en Tiempo Real Ligero), que se basa en YOLOv8n. El modelo mejora la estructura Bottleneck del módulo C2f integrando Convolución Parcial (PConv) con Convolución Punto a Punto (PWConv), logrando un diseño más ligero. Además, durante la etapa de fusión de características, la estructura de submuestreo original con convolución ordinaria se reemplaza por una combinación de max pooling y convolución regular. Esta modificación retiene más información del mapa de características. La estructura del modelo se optimiza aún más rediseñando la cabeza de detección desacoplada con Convolución de Grupo (GConv) en lugar de convolución ordinaria, mejorando significativamente la velocidad de detección. Además, la BCELoss original se reemplaza con EMASlideLoss, una nueva función de pérdida de clasificación introducida en este estudio. Esta función de pérdida permite que el modelo se enfoque más en muestras difíciles, mejorando así su capacidad de clasificación. En comparación con el algoritmo YOLOv8n, LRI-YOLO es más ligero, con sus parámetros reducidos en un 46.7% y las operaciones de punto flotante (FLOPs) reducidas en un 53.1%. Además, la precisión media promedio (mAP) alcanzó el 94.1%. Notablemente, en dispositivos con potencia computacional moderada que solo tienen una Unidad Central de Procesamiento (CPU), la velocidad de detección alcanzó 42 fotogramas por segundo (FPS), superando la mayoría de los modelos convencionales. Esto indica que LRI-YOLO ofrece una solución novedosa para la detección de objetos infrarrojos en tiempo real en dispositivos de borde como drones.