Evaluación empírica y análisis de modelos YOLO en transporte inteligente
Autores: Nguyen, Lan Anh; Tran, Manh Dat; Son, Yongseok
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Evaluación empírica y análisis de modelos YOLO en transporte inteligente
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Yolo
Variantes
Algoritmos de detección de objetos
Transporte inteligente
Evaluación de rendimiento
Modelos óptimos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 48
Citaciones: Sin citaciones
Solo Mira Una Vez (YOLO) y sus variantes han surgido como los algoritmos de detección de objetos en tiempo real más populares. Han sido ampliamente utilizados en aplicaciones de transporte inteligente en tiempo real debido a su detección de baja latencia y alta precisión. Sin embargo, debido a las diversas características de los modelos YOLO, seleccionar el modelo óptimo según las distintas aplicaciones y entornos en el transporte inteligente es crítico. En este artículo, realizamos un estudio de evaluación y análisis empírico para la mayoría de las versiones de YOLO para evaluar su rendimiento en el transporte inteligente. Para lograr esto, primero medimos la precisión promedio de los modelos YOLO en múltiples conjuntos de datos (es decir, COCO y PASCAL VOC). En segundo lugar, analizamos el rendimiento de los modelos YOLO en múltiples categorías de objetos dentro de cada conjunto de datos, centrándonos en clases relevantes para el transporte por carretera, como las comúnmente utilizadas en aplicaciones de transporte inteligente. En tercer lugar, consideramos múltiples umbrales de Intersección sobre Unión (IoU) en nuestra medición y análisis de rendimiento. Al examinar el rendimiento de varios modelos YOLO en conjuntos de datos, umbrales de IoU y clases de objetos, realizamos seis observaciones sobre estos tres aspectos con el objetivo de identificar modelos óptimos para escenarios de transporte por carretera. Se encontró que YOLOv5 y YOLOv8 superan a otros modelos en los tres aspectos debido a sus nuevas características de rendimiento. Por ejemplo, YOLOv5 logra un rendimiento estable gracias a su espinazo parcial cruzado darknet-53 (CSPDarknet53), mecanismo de auto-áncora y funciones de pérdida eficientes que incluyen pérdida de IoU, pérdida de IoU completa, pérdida focal, pérdida de mecanismo de armonización de gradientes. De manera similar, YOLOv8 supera a los demás con su espinazo CSPDarknet53 actualizado, mecanismo sin áncoras y funciones de pérdida eficientes como pérdida de IoU completa y pérdida focal de distribución.
Descripción
Solo Mira Una Vez (YOLO) y sus variantes han surgido como los algoritmos de detección de objetos en tiempo real más populares. Han sido ampliamente utilizados en aplicaciones de transporte inteligente en tiempo real debido a su detección de baja latencia y alta precisión. Sin embargo, debido a las diversas características de los modelos YOLO, seleccionar el modelo óptimo según las distintas aplicaciones y entornos en el transporte inteligente es crítico. En este artículo, realizamos un estudio de evaluación y análisis empírico para la mayoría de las versiones de YOLO para evaluar su rendimiento en el transporte inteligente. Para lograr esto, primero medimos la precisión promedio de los modelos YOLO en múltiples conjuntos de datos (es decir, COCO y PASCAL VOC). En segundo lugar, analizamos el rendimiento de los modelos YOLO en múltiples categorías de objetos dentro de cada conjunto de datos, centrándonos en clases relevantes para el transporte por carretera, como las comúnmente utilizadas en aplicaciones de transporte inteligente. En tercer lugar, consideramos múltiples umbrales de Intersección sobre Unión (IoU) en nuestra medición y análisis de rendimiento. Al examinar el rendimiento de varios modelos YOLO en conjuntos de datos, umbrales de IoU y clases de objetos, realizamos seis observaciones sobre estos tres aspectos con el objetivo de identificar modelos óptimos para escenarios de transporte por carretera. Se encontró que YOLOv5 y YOLOv8 superan a otros modelos en los tres aspectos debido a sus nuevas características de rendimiento. Por ejemplo, YOLOv5 logra un rendimiento estable gracias a su espinazo parcial cruzado darknet-53 (CSPDarknet53), mecanismo de auto-áncora y funciones de pérdida eficientes que incluyen pérdida de IoU, pérdida de IoU completa, pérdida focal, pérdida de mecanismo de armonización de gradientes. De manera similar, YOLOv8 supera a los demás con su espinazo CSPDarknet53 actualizado, mecanismo sin áncoras y funciones de pérdida eficientes como pérdida de IoU completa y pérdida focal de distribución.