Un nuevo modelo de aprendizaje profundo con aprendizaje guiado a múltiples escalas para la localización de la manipulación de imágenes
Autores: Li, Zhongwang; You, Qi; Sun, Jun
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un nuevo modelo de aprendizaje profundo con aprendizaje guiado a múltiples escalas para la localización de la manipulación de imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Localización de empalme de imágenes
Modelo de aprendizaje profundo
Estrategia de aprendizaje guiada a múltiples escalas
Mecanismos de autoatención espacial y de canal
Conjunto de datos CASIA
Resultados experimentales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El objetivo de la localización de la manipulación de imágenes es detectar el área manipulada en una imagen de entrada. Los modelos de aprendizaje profundo han mostrado un buen rendimiento en esta tarea, pero generalmente no pueden detectar bien los límites del área manipulada. En este documento, proponemos un nuevo modelo de aprendizaje profundo para la localización de la manipulación de imágenes que no solo considera las características locales de la imagen, sino que también extrae información global de las imágenes mediante una estrategia de aprendizaje guiada a múltiples escalas. Además, el modelo integra mecanismos de autoatención espacial y de canal para centrarse en extraer características importantes en lugar de restringir características no importantes o ruidosas. El modelo propuesto se entrena en el conjunto de datos CASIA v2.0 y su rendimiento se prueba en los conjuntos de datos CASIA v1.0, Columbia Uncompressed y DSO-1. Los resultados experimentales muestran que, con la ayuda de la estrategia de aprendizaje guiada a múltiples escalas y los mecanismos de autoatención, el modelo propuesto puede localizar el área manipulada de manera más efectiva que los modelos de vanguardia.
Descripción
El objetivo de la localización de la manipulación de imágenes es detectar el área manipulada en una imagen de entrada. Los modelos de aprendizaje profundo han mostrado un buen rendimiento en esta tarea, pero generalmente no pueden detectar bien los límites del área manipulada. En este documento, proponemos un nuevo modelo de aprendizaje profundo para la localización de la manipulación de imágenes que no solo considera las características locales de la imagen, sino que también extrae información global de las imágenes mediante una estrategia de aprendizaje guiada a múltiples escalas. Además, el modelo integra mecanismos de autoatención espacial y de canal para centrarse en extraer características importantes en lugar de restringir características no importantes o ruidosas. El modelo propuesto se entrena en el conjunto de datos CASIA v2.0 y su rendimiento se prueba en los conjuntos de datos CASIA v1.0, Columbia Uncompressed y DSO-1. Los resultados experimentales muestran que, con la ayuda de la estrategia de aprendizaje guiada a múltiples escalas y los mecanismos de autoatención, el modelo propuesto puede localizar el área manipulada de manera más efectiva que los modelos de vanguardia.