Generación de datos sintéticos para acelerar el pipeline de reconocimiento de objetos
Autores: Perri, Damiano; Simonetti, Marco; Gervasi, Osvaldo
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Generación de datos sintéticos para acelerar el pipeline de reconocimiento de objetos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Metodología
Imágenes sintéticas
Redes neuronales
Software de modelado 3D
Aumento de datos
Fase de entrenamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Este documento proporciona una metodología para la producción de imágenes sintéticas para entrenar redes neuronales en el reconocimiento de formas y objetos. Hay muchos escenarios en los que es difícil, costoso e incluso peligroso producir un conjunto de imágenes satisfactorio para el entrenamiento de una red neuronal. El desarrollo de software de modelado 3D ha alcanzado hoy en día un nivel de realismo y facilidad de uso tal que parecía natural explorar este camino innovador y dar una respuesta sobre la fiabilidad de este método que basa el entrenamiento de la red neuronal en imágenes sintéticas. Los resultados obtenidos en los dos casos de uso propuestos, el reconocimiento de un estilo pictórico y el reconocimiento de hombres en el mar, nos llevan a apoyar la validez del enfoque, siempre que el trabajo se realice de manera muy escrupulosa y rigurosa, explotando todo el potencial del software de modelado. El código producido, que genera automáticamente las transformaciones necesarias para la ampliación de datos de cada imagen, y la generación de condiciones ambientales aleatorias en el caso de los software Blender y Unity3D, está disponible bajo la licencia GPL en GitHub. Los resultados obtenidos nos llevan a afirmar que a través de las buenas prácticas presentadas en el artículo, hemos definido un método simple, fiable, económico y seguro para alimentar la fase de entrenamiento de una red neuronal dedicada al reconocimiento de objetos y características que se pueden aplicar a diversos contextos.
Descripción
Este documento proporciona una metodología para la producción de imágenes sintéticas para entrenar redes neuronales en el reconocimiento de formas y objetos. Hay muchos escenarios en los que es difícil, costoso e incluso peligroso producir un conjunto de imágenes satisfactorio para el entrenamiento de una red neuronal. El desarrollo de software de modelado 3D ha alcanzado hoy en día un nivel de realismo y facilidad de uso tal que parecía natural explorar este camino innovador y dar una respuesta sobre la fiabilidad de este método que basa el entrenamiento de la red neuronal en imágenes sintéticas. Los resultados obtenidos en los dos casos de uso propuestos, el reconocimiento de un estilo pictórico y el reconocimiento de hombres en el mar, nos llevan a apoyar la validez del enfoque, siempre que el trabajo se realice de manera muy escrupulosa y rigurosa, explotando todo el potencial del software de modelado. El código producido, que genera automáticamente las transformaciones necesarias para la ampliación de datos de cada imagen, y la generación de condiciones ambientales aleatorias en el caso de los software Blender y Unity3D, está disponible bajo la licencia GPL en GitHub. Los resultados obtenidos nos llevan a afirmar que a través de las buenas prácticas presentadas en el artículo, hemos definido un método simple, fiable, económico y seguro para alimentar la fase de entrenamiento de una red neuronal dedicada al reconocimiento de objetos y características que se pueden aplicar a diversos contextos.