Un modelo basado en YOLOv5 ligero con fusión de características y convolución de dilatación para segmentación de imágenes
Autores: Chen, Linwei; Yang, Jingjing
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un modelo basado en YOLOv5 ligero con fusión de características y convolución de dilatación para segmentación de imágenes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Segmentación de imágenes
YOLOv5
MobileViT
Fusión de características
Convolución dilatada
Calidad de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
La segmentación de imágenes ha desempeñado un papel esencial en la visión por computadora. El modelo de detección de objetivos representado por YOLOv5 se utiliza ampliamente en la segmentación de imágenes. Sin embargo, YOLOv5 tiene cuellos de botella de rendimiento como variación de escala de objetos, oclusión de objetos, volumen computacional y velocidad al procesar imágenes complejas. Para resolver estos problemas, se propone un algoritmo mejorado basado en YOLOv5. MobileViT se utiliza como la red principal del algoritmo YOLOv5, y se agregan fusión de características y convolución dilatada al modelo. Este método se valida en los conjuntos de datos COCO y PASCAL-VOC. Los resultados experimentales muestran que reduce significativamente el tiempo de procesamiento y logra una alta calidad de segmentación con una precisión del 95.32% en COCO y del 96.02% en PASCAL-VOC. El modelo mejorado es 116 M, 52 M y 76 M más pequeño que U-Net, SegNet y Mask R-CNN, respectivamente. Este artículo proporciona una nueva idea y método para resolver los problemas en el campo de la segmentación de imágenes, y el método tiene una fuerte practicidad y valor de generalización.
Descripción
La segmentación de imágenes ha desempeñado un papel esencial en la visión por computadora. El modelo de detección de objetivos representado por YOLOv5 se utiliza ampliamente en la segmentación de imágenes. Sin embargo, YOLOv5 tiene cuellos de botella de rendimiento como variación de escala de objetos, oclusión de objetos, volumen computacional y velocidad al procesar imágenes complejas. Para resolver estos problemas, se propone un algoritmo mejorado basado en YOLOv5. MobileViT se utiliza como la red principal del algoritmo YOLOv5, y se agregan fusión de características y convolución dilatada al modelo. Este método se valida en los conjuntos de datos COCO y PASCAL-VOC. Los resultados experimentales muestran que reduce significativamente el tiempo de procesamiento y logra una alta calidad de segmentación con una precisión del 95.32% en COCO y del 96.02% en PASCAL-VOC. El modelo mejorado es 116 M, 52 M y 76 M más pequeño que U-Net, SegNet y Mask R-CNN, respectivamente. Este artículo proporciona una nueva idea y método para resolver los problemas en el campo de la segmentación de imágenes, y el método tiene una fuerte practicidad y valor de generalización.