Utilizando la función de pérdida de ArcFace y la función de activación de Softmax con temperatura para mejorar la calidad de clasificación de imágenes de equipaje de rayos X
Autores: Andriyanov, Nikita
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Utilizando la función de pérdida de ArcFace y la función de activación de Softmax con temperatura para mejorar la calidad de clasificación de imágenes de equipaje de rayos X
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Sistemas de seguridad de la aviación
Operadores de escaneo
Imágenes de rayos X
Recursos computacionales
Arquitecturas de redes neuronales
Redes neuronales convolucionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Los sistemas modernos de seguridad de la aviación están en gran medida vinculados al trabajo de los operadores de escáner. Debido a características físicas, son propensos a problemas como fatiga, pérdida de atención, etc. Hay métodos para reconocer tales objetos, pero enfrentan dificultades como la estructura específica de las imágenes de rayos X del equipaje. Además, estos sistemas requieren recursos computacionales significativos al aumentar el tamaño de los modelos. Superar la primera y segunda desventaja puede depender en gran medida del plano de hardware. Se necesitan nuevos introspectos y técnicas de registro, así como dispositivos informáticos más potentes. Sin embargo, para el procesamiento, es más preferible mejorar la calidad sin aumentar los requisitos de potencia computacional del sistema de reconocimiento. Esto se puede lograr en arquitecturas tradicionales de redes neuronales, pero con un proceso de entrenamiento más complejo. En este estudio se propone un nuevo enfoque de entrenamiento. Se proponen nuevas formas de aumento de imágenes de rayos X de equipaje y enfoques avanzados para el entrenamiento de redes neuronales convolucionales y redes transformadoras de visión. Se muestra que el uso de la función de pérdida ArcFace para la tarea de clasificación binaria de elementos en clases prohibidas y permitidas proporciona una ganancia de aproximadamente 3-5% para diferentes arquitecturas. Al mismo tiempo, el uso de la función de activación softmax con temperatura permite obtener estimaciones más flexibles de la probabilidad de pertenencia, lo que, al establecer el umbral, permite aumentar significativamente la precisión del reconocimiento de elementos prohibidos, y cuando se reduce, proporciona un alto recuerdo de reconocimiento. Las aumentaciones desarrolladas basadas en modelos de imágenes estocásticas doblemente permiten aumentar el recuerdo de reconocer elementos peligrosos en un 1-2%. Sobre la base del clasificador desarrollado, se modificó el detector YOLO y se obtuvo una ganancia de mAP del 0,72%. Por lo tanto, los resultados de la investigación se ajustan al objetivo de aumentar la eficiencia en el procesamiento de imágenes de rayos X de equipaje.
Descripción
Los sistemas modernos de seguridad de la aviación están en gran medida vinculados al trabajo de los operadores de escáner. Debido a características físicas, son propensos a problemas como fatiga, pérdida de atención, etc. Hay métodos para reconocer tales objetos, pero enfrentan dificultades como la estructura específica de las imágenes de rayos X del equipaje. Además, estos sistemas requieren recursos computacionales significativos al aumentar el tamaño de los modelos. Superar la primera y segunda desventaja puede depender en gran medida del plano de hardware. Se necesitan nuevos introspectos y técnicas de registro, así como dispositivos informáticos más potentes. Sin embargo, para el procesamiento, es más preferible mejorar la calidad sin aumentar los requisitos de potencia computacional del sistema de reconocimiento. Esto se puede lograr en arquitecturas tradicionales de redes neuronales, pero con un proceso de entrenamiento más complejo. En este estudio se propone un nuevo enfoque de entrenamiento. Se proponen nuevas formas de aumento de imágenes de rayos X de equipaje y enfoques avanzados para el entrenamiento de redes neuronales convolucionales y redes transformadoras de visión. Se muestra que el uso de la función de pérdida ArcFace para la tarea de clasificación binaria de elementos en clases prohibidas y permitidas proporciona una ganancia de aproximadamente 3-5% para diferentes arquitecturas. Al mismo tiempo, el uso de la función de activación softmax con temperatura permite obtener estimaciones más flexibles de la probabilidad de pertenencia, lo que, al establecer el umbral, permite aumentar significativamente la precisión del reconocimiento de elementos prohibidos, y cuando se reduce, proporciona un alto recuerdo de reconocimiento. Las aumentaciones desarrolladas basadas en modelos de imágenes estocásticas doblemente permiten aumentar el recuerdo de reconocer elementos peligrosos en un 1-2%. Sobre la base del clasificador desarrollado, se modificó el detector YOLO y se obtuvo una ganancia de mAP del 0,72%. Por lo tanto, los resultados de la investigación se ajustan al objetivo de aumentar la eficiencia en el procesamiento de imágenes de rayos X de equipaje.