Aumento de datos basado en GAN con cambios de color de vehículos para entrenar una CNN de detección de vehículos
Autores: Ayub, Aroona; Kim, HyungWon
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aumento de datos basado en GAN con cambios de color de vehículos para entrenar una CNN de detección de vehículos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de objetos
Redes neuronales convolucionales
Modelos generativos
Aumento de datos
Red ColorGAN
Conjunto de datos aumentado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La detección de objetos es una tarea desafiante que requiere una gran cantidad de datos etiquetados para entrenar redes neuronales convolucionales (CNN) que puedan alcanzar una precisión a nivel humano. Sin embargo, obtener tales datos no es fácil, ya que implican un trabajo manual significativo y costos para anotar los objetos en las imágenes. Los investigadores han utilizado técnicas tradicionales de aumento de datos para aumentar la cantidad de datos de entrenamiento disponibles para ellos. Una tendencia reciente en la detección de objetos es utilizar modelos generativos para crear automáticamente datos anotados que puedan enriquecer un conjunto de entrenamiento y mejorar el rendimiento del modelo objetivo. Este documento presenta un método para entrenar la red ColorGAN propuesta, que se utiliza para generar datos aumentados para el dominio de interés con el menor compromiso en calidad. Demostramos un método para entrenar una GAN con imágenes de vehículos de diferentes colores. Luego, demostramos que nuestro ColorGAN puede cambiar el color de los vehículos de cualquier conjunto de datos de vehículos dado a un conjunto de colores especificados, que pueden servir como un conjunto de datos de entrenamiento aumentado. Nuestros resultados experimentales muestran que el conjunto de datos aumentado generado por el método propuesto ayuda a mejorar el rendimiento de detección de una CNN para aplicaciones donde los datos de entrenamiento originales son limitados. Nuestros experimentos también muestran que el modelo puede alcanzar un mAP más alto del 76% cuando el modelo se entrena con imágenes aumentadas junto con el conjunto de datos de entrenamiento original.
Descripción
La detección de objetos es una tarea desafiante que requiere una gran cantidad de datos etiquetados para entrenar redes neuronales convolucionales (CNN) que puedan alcanzar una precisión a nivel humano. Sin embargo, obtener tales datos no es fácil, ya que implican un trabajo manual significativo y costos para anotar los objetos en las imágenes. Los investigadores han utilizado técnicas tradicionales de aumento de datos para aumentar la cantidad de datos de entrenamiento disponibles para ellos. Una tendencia reciente en la detección de objetos es utilizar modelos generativos para crear automáticamente datos anotados que puedan enriquecer un conjunto de entrenamiento y mejorar el rendimiento del modelo objetivo. Este documento presenta un método para entrenar la red ColorGAN propuesta, que se utiliza para generar datos aumentados para el dominio de interés con el menor compromiso en calidad. Demostramos un método para entrenar una GAN con imágenes de vehículos de diferentes colores. Luego, demostramos que nuestro ColorGAN puede cambiar el color de los vehículos de cualquier conjunto de datos de vehículos dado a un conjunto de colores especificados, que pueden servir como un conjunto de datos de entrenamiento aumentado. Nuestros resultados experimentales muestran que el conjunto de datos aumentado generado por el método propuesto ayuda a mejorar el rendimiento de detección de una CNN para aplicaciones donde los datos de entrenamiento originales son limitados. Nuestros experimentos también muestran que el modelo puede alcanzar un mAP más alto del 76% cuando el modelo se entrena con imágenes aumentadas junto con el conjunto de datos de entrenamiento original.