Modelo implícito de difusión de denoising para la detección de objetos camuflados
Autores: Cai, Wei; Gao, Weijie; Jiang, Xinhao; Wang, Xin; Di, Xingyu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Modelo implícito de difusión de denoising para la detección de objetos camuflados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Objetos camuflados
Modelo de difusión
DMNet
Extracción de características
Detección de objetos
Métricas de evaluación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La detección de objetos camuflados (COD) es una tarea desafiante que implica identificar objetos que se asemejan estrechamente a su fondo. Para detectar objetos camuflados de manera más precisa, proponemos un modelo de difusión para la red COD llamado DMNet. DMNet formula COD como un proceso de difusión de eliminación de ruido de cajas ruidosas a cajas de predicción. Durante la etapa de entrenamiento, las cajas aleatorias se difunden desde las cajas de verdad terreno, y DMNet aprende a revertir este proceso. En la etapa de muestreo, DMNet refina progresivamente las cajas aleatorias a cajas de predicción. Además, debido a la apariencia borrosa del objeto camuflado y al bajo contraste entre éste y el fondo, la etapa de extracción de características de la red es desafiante. En primer lugar, propusimos un módulo de fusión paralelo (PFM) para mejorar la información extraída de la columna vertebral. Luego, diseñamos una red progresiva de pirámide de características (PFPN) para la fusión de características, en la que el módulo de fusión espacial adaptativa de aumento de muestreo (UAF) equilibra la información de características diferente asignando pesos a diferentes capas. Finalmente, se construye un módulo de refinamiento de ubicación (LRM) para que DMNet preste atención a los detalles de los límites. Comparamos DMNet con otros modelos clásicos de detección de objetos en el conjunto de datos COD10K. Los resultados experimentales indicaron que DMNet superó a los demás, logrando efectos óptimos en seis métricas de evaluación y mejorando significativamente la precisión de detección.
Descripción
La detección de objetos camuflados (COD) es una tarea desafiante que implica identificar objetos que se asemejan estrechamente a su fondo. Para detectar objetos camuflados de manera más precisa, proponemos un modelo de difusión para la red COD llamado DMNet. DMNet formula COD como un proceso de difusión de eliminación de ruido de cajas ruidosas a cajas de predicción. Durante la etapa de entrenamiento, las cajas aleatorias se difunden desde las cajas de verdad terreno, y DMNet aprende a revertir este proceso. En la etapa de muestreo, DMNet refina progresivamente las cajas aleatorias a cajas de predicción. Además, debido a la apariencia borrosa del objeto camuflado y al bajo contraste entre éste y el fondo, la etapa de extracción de características de la red es desafiante. En primer lugar, propusimos un módulo de fusión paralelo (PFM) para mejorar la información extraída de la columna vertebral. Luego, diseñamos una red progresiva de pirámide de características (PFPN) para la fusión de características, en la que el módulo de fusión espacial adaptativa de aumento de muestreo (UAF) equilibra la información de características diferente asignando pesos a diferentes capas. Finalmente, se construye un módulo de refinamiento de ubicación (LRM) para que DMNet preste atención a los detalles de los límites. Comparamos DMNet con otros modelos clásicos de detección de objetos en el conjunto de datos COD10K. Los resultados experimentales indicaron que DMNet superó a los demás, logrando efectos óptimos en seis métricas de evaluación y mejorando significativamente la precisión de detección.