Generación de datos sintéticos basada en RDB-CycleGAN para la detección de objetos industriales
Autores: Hu, Jiwei; Xiao, Feng; Jin, Qiwen; Zhao, Guangpeng; Lou, Ping
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Generación de datos sintéticos basada en RDB-CycleGAN para la detección de objetos industriales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje profundo
Detección de objetos
Generación de datos sintéticos
Traducción de imagen a imagen
Bloque denso residual
Modelos CAD
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Los métodos basados en aprendizaje profundo han demostrado un éxito notable en tareas de detección de objetos cuando se dispone de una gran cantidad de datos de entrenamiento. Sin embargo, en el ámbito industrial, adquirir una cantidad suficiente de datos de entrenamiento ha sido un desafío. Actualmente, se crean muchos conjuntos de datos sintéticos utilizando software de modelado 3D, que pueden simular escenarios y objetos del mundo real pero a menudo no logran una precisión y realismo completos. En este documento, proponemos un marco de generación de datos sintéticos para tareas de detección de objetos industriales basado en traducción de imagen a imagen. Para abordar el problema de la baja calidad de imagen que puede surgir durante el proceso de traducción de imagen, hemos reemplazado el módulo de extracción de características original con el módulo de Bloque Denso Residual (RDB). Empleamos la red RDB-CycleGAN para transformar modelos CAD en imágenes realistas. Además, hemos introducido la función de pérdida SSIM para fortalecer las restricciones de red del generador y realizamos un análisis cuantitativo de los datos sintéticos generados mejorados por RDB-CycleGAN. Para evaluar la efectividad de nuestro método propuesto, los datos sintéticos que generamos mejoran efectivamente el rendimiento de los algoritmos de detección de objetos en imágenes reales. En comparación con el uso directo de modelos CAD, los datos sintéticos se adaptan mejor a escenarios del mundo real y mejoran la capacidad de generalización del modelo.
Descripción
Los métodos basados en aprendizaje profundo han demostrado un éxito notable en tareas de detección de objetos cuando se dispone de una gran cantidad de datos de entrenamiento. Sin embargo, en el ámbito industrial, adquirir una cantidad suficiente de datos de entrenamiento ha sido un desafío. Actualmente, se crean muchos conjuntos de datos sintéticos utilizando software de modelado 3D, que pueden simular escenarios y objetos del mundo real pero a menudo no logran una precisión y realismo completos. En este documento, proponemos un marco de generación de datos sintéticos para tareas de detección de objetos industriales basado en traducción de imagen a imagen. Para abordar el problema de la baja calidad de imagen que puede surgir durante el proceso de traducción de imagen, hemos reemplazado el módulo de extracción de características original con el módulo de Bloque Denso Residual (RDB). Empleamos la red RDB-CycleGAN para transformar modelos CAD en imágenes realistas. Además, hemos introducido la función de pérdida SSIM para fortalecer las restricciones de red del generador y realizamos un análisis cuantitativo de los datos sintéticos generados mejorados por RDB-CycleGAN. Para evaluar la efectividad de nuestro método propuesto, los datos sintéticos que generamos mejoran efectivamente el rendimiento de los algoritmos de detección de objetos en imágenes reales. En comparación con el uso directo de modelos CAD, los datos sintéticos se adaptan mejor a escenarios del mundo real y mejoran la capacidad de generalización del modelo.