logo móvil
Contáctanos

Imágenes de seguridad de rayos X eficientes para la detección de mercancías peligrosas basadas en YOLOv7 mejorado

Autores: Liu, Yan; Zhang, Enyan; Yu, Xiaoyu; Wang, Aili

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Imágenes de seguridad de rayos X eficientes para la detección de mercancías peligrosas basadas en YOLOv7 mejorado


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Propone un algoritmo de detección de alta precisión para imágenes de seguridad de rayos X
Mejora la fusión de características a múltiples escalas en la estructura de downsampling de la red
Extracción de características del modelo YOLOv7
Capacidad de localización del objetivo
Representaciones de características
Conjuntos de datos públicos
SIXRay
CLCXray
PIDray
Precisión de detección
MAP
Modelo mejorado
Efectividad
Universalidad
Corriente principal
Bienes peligrosos
Tasa de detección falsa
Imágenes de inspección de seguridad
Mejora significativa
Objetivos pequeños.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 36

Citaciones: Sin citaciones


Descripción
En respuesta a los problemas de fondo complejo, mercancías peligrosas multi-escala y apilamiento severo en imágenes de seguridad de rayos X, este artículo propone un algoritmo de detección de mercancías peligrosas de alta precisión para imágenes de seguridad de rayos X basado en la mejora de YOLOv7. Primero, al combinar el mecanismo de atención a las coordenadas, se mejora la estructura de submuestreo de la red principal para potenciar la capacidad de localización de características del objetivo del modelo. En segundo lugar, se utiliza una red piramidal de características bidireccionales ponderadas como estructura de fusión de características para lograr una fusión ponderada de características multi-escala y simplificar aún más la red. Luego, combinado con la convolución de serpiente dinámica, se diseñó una estructura de submuestreo para facilitar la extracción de características en diferentes escalas, proporcionando representaciones de características más ricas. Finalmente, tomando inspiración de la idea de convolución de grupo y combinándola con Conv2Former, se diseñó un módulo de extracción de características llamado transformador de multi-convolución (MCT) para potenciar la capacidad de extracción de características de la red al combinar información multi-escala. El YOLOv7 mejorado en este artículo se probó en los conjuntos de datos públicos SIXRay, CLCXray y PIDray. La precisión de detección promedio (mAP) del modelo mejorado fue del 96.3%, 79.3% y 84.7%, respectivamente, lo que fue 4.7%, 2.7% y 3.1% más alto que YOLOv7. Esto demuestra la efectividad y universalidad del método propuesto en este artículo. En comparación con los modelos actuales de detección de mercancías peligrosas en imágenes de inspección de seguridad de rayos X, este modelo reduce efectivamente la tasa de detección falsa de mercancías peligrosas en las imágenes de inspección de seguridad de rayos X y ha logrado una mejora significativa en la detección de objetivos pequeños y multi-escala, logrando una mayor precisión en la detección de mercancías peligrosas.

Otros recursos que podrían interesarte

Temas Virtualpro