Compresión del modelo de detección de objetos de imágenes de teledetección a través de la descomposición de Tucker
Autores: Huyan, Lang; Li, Ying; Jiang, Dongmei; Zhang, Yanning; Zhou, Quan; Li, Bo; Wei, Jiayuan; Liu, Juanni; Zhang, Yi; Wang, Peng; Fang, Hai
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Compresión del modelo de detección de objetos de imágenes de teledetección a través de la descomposición de Tucker
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Redes neuronales convolucionales
Implementación
Tensores
Descomposición de rango bajo
Modelo de detección de objetos
Marco de compresión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Aunque las redes neuronales convolucionales (CNN) han logrado un progreso significativo, su implementación a bordo sigue siendo desafiante debido a su complejidad y alto costo de procesamiento. Los tensores proporcionan una representación natural y compacta de los pesos de CNN a través de aproximaciones de bajo rango adecuadas. Se propuso un módulo descompuesto novedoso llamado DecomResnet basado en la descomposición de Tucker para implementar un modelo de detección de objetos CNN en un satélite. Propusimos un marco de compresión de modelo de detección de objetos de imágenes de teledetección basado en la descomposición de rango bajo que constaba de cuatro pasos, a saber, (1) inicialización del modelo, (2) entrenamiento inicial, (3) descomposición del modelo entrenado y reconstrucción del modelo descompuesto, y (4) ajuste fino. Para validar el rendimiento del modelo descompuesto en nuestra misión real, construimos un conjunto de datos que contenía solo dos clases de objetos basados en DOTA y HRSC2016. El método propuesto fue evaluado exhaustivamente en el conjunto de datos NWPU VHR-10 y en el conjunto de datos CAST-RS2 creado en este trabajo. Los resultados experimentales demostraron que el método propuesto, basado en Resnet-50, podría lograr hasta 4.44 veces la relación de compresión y 5.71 veces la relación de aceleración con apenas una disminución del 1.9% en el mAP (precisión promedio) del conjunto de datos CAST-RS2 y una disminución del 5.3% en el mAP del conjunto de datos NWPU VHR-10.
Descripción
Aunque las redes neuronales convolucionales (CNN) han logrado un progreso significativo, su implementación a bordo sigue siendo desafiante debido a su complejidad y alto costo de procesamiento. Los tensores proporcionan una representación natural y compacta de los pesos de CNN a través de aproximaciones de bajo rango adecuadas. Se propuso un módulo descompuesto novedoso llamado DecomResnet basado en la descomposición de Tucker para implementar un modelo de detección de objetos CNN en un satélite. Propusimos un marco de compresión de modelo de detección de objetos de imágenes de teledetección basado en la descomposición de rango bajo que constaba de cuatro pasos, a saber, (1) inicialización del modelo, (2) entrenamiento inicial, (3) descomposición del modelo entrenado y reconstrucción del modelo descompuesto, y (4) ajuste fino. Para validar el rendimiento del modelo descompuesto en nuestra misión real, construimos un conjunto de datos que contenía solo dos clases de objetos basados en DOTA y HRSC2016. El método propuesto fue evaluado exhaustivamente en el conjunto de datos NWPU VHR-10 y en el conjunto de datos CAST-RS2 creado en este trabajo. Los resultados experimentales demostraron que el método propuesto, basado en Resnet-50, podría lograr hasta 4.44 veces la relación de compresión y 5.71 veces la relación de aceleración con apenas una disminución del 1.9% en el mAP (precisión promedio) del conjunto de datos CAST-RS2 y una disminución del 5.3% en el mAP del conjunto de datos NWPU VHR-10.