Fondo de datos de aumento de copia y pegado basado en instancias para detección de objetos
Autores: Zhang, Liuying; Xing, Zhiqiang; Wang, Xikun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Fondo de datos de aumento de copia y pegado basado en instancias para detección de objetos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Método propuesto
Aumento de datos
Detección de objetos
Conjunto de datos
Pseudoetiquetas de fondo
Relevancia contextual
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
En el aprendizaje profundo supervisado de detección de objetos, la cantidad de información de objetos y la calidad de las anotaciones en un conjunto de datos afectan el rendimiento del modelo. Para aumentar los conjuntos de datos de detección de objetos manteniendo la información contextual entre objetos y fondos, propusimos un modelo de aumento de datos denominado Copia-Pega Basado en Instancias de Fondo (BIB-Copy-Paste). Diseñamos un método para generar pseudoetiquetas de fondo para todas las clases de objetos calculando la similitud entre las características de fondo del objeto y las características de la región de la imagen en el espacio euclidiano. El clasificador de fondo, entrenado con estas pseudoetiquetas, puede guiar la copia y el pegado para garantizar la relevancia contextual. Varios detectores de objetos supervisados fueron evaluados en el conjunto de datos PASCAL VOC 2012, logrando una mejora promedio del 1.1% en la precisión promedio media. Experimentos de ablación con el detector de objetos BlitzNet en el conjunto de datos PASCAL VOC 2012 mostraron una mejora del mAP del 1.19% utilizando el método propuesto, en comparación con una mejora del 0.18% con copia y pegado aleatorio. También se seleccionaron imágenes del conjunto de datos MS COCO que contenían objetos de las mismas clases que en PASCAL VOC 2012 para experimentos de pegado de objetos. La relevancia contextual de los objetos pegados demostró la efectividad y transferibilidad de nuestro modelo entre conjuntos de datos con la misma clase de objetos.
Descripción
En el aprendizaje profundo supervisado de detección de objetos, la cantidad de información de objetos y la calidad de las anotaciones en un conjunto de datos afectan el rendimiento del modelo. Para aumentar los conjuntos de datos de detección de objetos manteniendo la información contextual entre objetos y fondos, propusimos un modelo de aumento de datos denominado Copia-Pega Basado en Instancias de Fondo (BIB-Copy-Paste). Diseñamos un método para generar pseudoetiquetas de fondo para todas las clases de objetos calculando la similitud entre las características de fondo del objeto y las características de la región de la imagen en el espacio euclidiano. El clasificador de fondo, entrenado con estas pseudoetiquetas, puede guiar la copia y el pegado para garantizar la relevancia contextual. Varios detectores de objetos supervisados fueron evaluados en el conjunto de datos PASCAL VOC 2012, logrando una mejora promedio del 1.1% en la precisión promedio media. Experimentos de ablación con el detector de objetos BlitzNet en el conjunto de datos PASCAL VOC 2012 mostraron una mejora del mAP del 1.19% utilizando el método propuesto, en comparación con una mejora del 0.18% con copia y pegado aleatorio. También se seleccionaron imágenes del conjunto de datos MS COCO que contenían objetos de las mismas clases que en PASCAL VOC 2012 para experimentos de pegado de objetos. La relevancia contextual de los objetos pegados demostró la efectividad y transferibilidad de nuestro modelo entre conjuntos de datos con la misma clase de objetos.