Compresión de características enmascaradas para la detección de objetos
Autores: Dai, Chengjie; Song, Tiantian; Jin, Yuxuan; Ren, Yixiang; Yang, Bowei; Song, Guanghua
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Compresión de características enmascaradas para la detección de objetos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Implementación
Modelos de detección de alta precisión
Dispositivos de borde ligeros
Compresión de imagen
Detección de objetos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Implementar modelos de detección de alta precisión en dispositivos ligeros de borde (por ejemplo, drones) es un desafío debido a las limitaciones de hardware. Para lograr resultados de detección satisfactorios, una solución común es comprimir y transmitir las imágenes a un servidor en la nube donde se pueden utilizar modelos potentes. Sin embargo, el proceso de compresión de imágenes para la transmisión puede provocar una reducción en la precisión de la detección. En este documento, proponemos un método de compresión de características diseñado para tareas de detección de objetos, y se puede integrar fácilmente con modelos de compresión de imágenes aprendidos existentes. En el método, el proceso de codificación consta de dos pasos. En primer lugar, utilizamos un extractor de características para obtener la característica de bajo nivel, y luego utilizamos un generador de máscaras para obtener una máscara de objeto que seleccione regiones que contienen objetos. En segundo lugar, utilizamos un codificador de red neuronal para comprimir la característica enmascarada. En cuanto a la decodificación, se utiliza un decodificador de red neuronal para restaurar la representación comprimida en la característica que se puede introducir directamente en el modelo de detección de objetos. Los resultados experimentales demuestran que nuestro método supera a las técnicas de compresión existentes. Específicamente, en comparación con uno de los métodos líderes, TCM2023, nuestro enfoque logra una reducción del 25.3% en el tamaño del archivo comprimido y un aumento del 6.9% en mAP0.5.
Descripción
Implementar modelos de detección de alta precisión en dispositivos ligeros de borde (por ejemplo, drones) es un desafío debido a las limitaciones de hardware. Para lograr resultados de detección satisfactorios, una solución común es comprimir y transmitir las imágenes a un servidor en la nube donde se pueden utilizar modelos potentes. Sin embargo, el proceso de compresión de imágenes para la transmisión puede provocar una reducción en la precisión de la detección. En este documento, proponemos un método de compresión de características diseñado para tareas de detección de objetos, y se puede integrar fácilmente con modelos de compresión de imágenes aprendidos existentes. En el método, el proceso de codificación consta de dos pasos. En primer lugar, utilizamos un extractor de características para obtener la característica de bajo nivel, y luego utilizamos un generador de máscaras para obtener una máscara de objeto que seleccione regiones que contienen objetos. En segundo lugar, utilizamos un codificador de red neuronal para comprimir la característica enmascarada. En cuanto a la decodificación, se utiliza un decodificador de red neuronal para restaurar la representación comprimida en la característica que se puede introducir directamente en el modelo de detección de objetos. Los resultados experimentales demuestran que nuestro método supera a las técnicas de compresión existentes. Específicamente, en comparación con uno de los métodos líderes, TCM2023, nuestro enfoque logra una reducción del 25.3% en el tamaño del archivo comprimido y un aumento del 6.9% en mAP0.5.