logo móvil
Contáctanos

Compresión del modelo de detección de objetos de imágenes de teledetección a través de la descomposición de Tucker

Autores: Huyan, Lang; Li, Ying; Jiang, Dongmei; Zhang, Yanning; Zhou, Quan; Li, Bo; Wei, Jiayuan; Liu, Juanni; Zhang, Yi; Wang, Peng; Fang, Hai

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Compresión del modelo de detección de objetos de imágenes de teledetección a través de la descomposición de Tucker


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Redes neuronales convolucionales
Implementación
Tensores
Descomposición de rango bajo
Modelo de detección de objetos
Marco de compresión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 21

Citaciones: Sin citaciones


Descripción
Aunque las redes neuronales convolucionales (CNN) han logrado un progreso significativo, su implementación a bordo sigue siendo desafiante debido a su complejidad y alto costo de procesamiento. Los tensores proporcionan una representación natural y compacta de los pesos de CNN a través de aproximaciones de bajo rango adecuadas. Se propuso un módulo descompuesto novedoso llamado DecomResnet basado en la descomposición de Tucker para implementar un modelo de detección de objetos CNN en un satélite. Propusimos un marco de compresión de modelo de detección de objetos de imágenes de teledetección basado en la descomposición de rango bajo que constaba de cuatro pasos, a saber, (1) inicialización del modelo, (2) entrenamiento inicial, (3) descomposición del modelo entrenado y reconstrucción del modelo descompuesto, y (4) ajuste fino. Para validar el rendimiento del modelo descompuesto en nuestra misión real, construimos un conjunto de datos que contenía solo dos clases de objetos basados en DOTA y HRSC2016. El método propuesto fue evaluado exhaustivamente en el conjunto de datos NWPU VHR-10 y en el conjunto de datos CAST-RS2 creado en este trabajo. Los resultados experimentales demostraron que el método propuesto, basado en Resnet-50, podría lograr hasta 4.44 veces la relación de compresión y 5.71 veces la relación de aceleración con apenas una disminución del 1.9% en el mAP (precisión promedio) del conjunto de datos CAST-RS2 y una disminución del 5.3% en el mAP del conjunto de datos NWPU VHR-10.

Otros recursos que podrían interesarte

Temas Virtualpro