Colocación eficiente de objetos a través de FTOPNet
Autores: Ye, Guosheng; Wang, Jianming; Yang, Zizhong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Colocación eficiente de objetos a través de FTOPNet
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Colocación
Objetos en primer plano
Imagen de fondo
Imagen compuesta
Extracción de características
Red
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La composición de imágenes implica la colocación de objetos en primer plano a una escala apropiada dentro de una imagen de fondo para crear una imagen compuesta visualmente realista. Sin embargo, las operaciones manuales para esta tarea son laboriosas y requieren mucho tiempo. En este estudio, proponemos un método eficiente para la colocación de objetos en primer plano, que consta de un módulo de extracción de características de fondo (BFEM) diseñado para imágenes de fondo y un módulo de fusión de características de atención cruzada de primer plano-fondo (FBCAFFM). El BFEM es capaz de extraer información precisa y completa de la imagen de fondo. Las características fusionadas permiten que la red aprenda información adicional relacionada con la coincidencia de primer plano-fondo, lo que ayuda en la predicción de la colocación y tamaño de los objetos en primer plano. Nuestros experimentos se llevan a cabo utilizando el conjunto de datos de evaluación de colocación de objetos (OPA) disponible públicamente. Tanto los resultados cuantitativos como visuales demuestran que FTOPNet realiza eficazmente la tarea de colocación de objetos en primer plano y ofrece una solución práctica para tareas de composición de imágenes.
Descripción
La composición de imágenes implica la colocación de objetos en primer plano a una escala apropiada dentro de una imagen de fondo para crear una imagen compuesta visualmente realista. Sin embargo, las operaciones manuales para esta tarea son laboriosas y requieren mucho tiempo. En este estudio, proponemos un método eficiente para la colocación de objetos en primer plano, que consta de un módulo de extracción de características de fondo (BFEM) diseñado para imágenes de fondo y un módulo de fusión de características de atención cruzada de primer plano-fondo (FBCAFFM). El BFEM es capaz de extraer información precisa y completa de la imagen de fondo. Las características fusionadas permiten que la red aprenda información adicional relacionada con la coincidencia de primer plano-fondo, lo que ayuda en la predicción de la colocación y tamaño de los objetos en primer plano. Nuestros experimentos se llevan a cabo utilizando el conjunto de datos de evaluación de colocación de objetos (OPA) disponible públicamente. Tanto los resultados cuantitativos como visuales demuestran que FTOPNet realiza eficazmente la tarea de colocación de objetos en primer plano y ofrece una solución práctica para tareas de composición de imágenes.