Traducción literal: Traducción de imagen a imagen basada en la augmentación de datos de daños estructurales para la inspección de infraestructuras utilizando vehículos aéreos no tripulados
Autores: Gwon, Gi-Hun; Lee, Jin-Hwan; Kim, In-Ho; Baek, Seung-Chan; Jung, Hyung-Jo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Traducción literal: Traducción de imagen a imagen basada en la augmentación de datos de daños estructurales para la inspección de infraestructuras utilizando vehículos aéreos no tripulados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Tecnología
UAVs
Sensores de imagen
Técnicas de aprendizaje profundo
Daños estructurales
Aumento de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
A medida que la tecnología avanza, el uso de vehículos aéreos no tripulados (VANT) y sensores de imagen para el monitoreo y diagnóstico estructural se vuelve cada vez más crítico. Este enfoque permite la inspección y evaluación eficiente de las condiciones estructurales. Además, se ha demostrado que la integración de técnicas de aprendizaje profundo es altamente efectiva para detectar daños a partir de imágenes estructurales, como se demuestra en nuestro estudio. Para permitir un aprendizaje efectivo por parte de los modelos de aprendizaje profundo, es crucial contar con un volumen sustancial de datos, pero la recolección de instancias apropiadas de daños estructurales en escenarios del mundo real presenta desafíos y exige conocimientos especializados, así como un tiempo y recursos significativos para la etiquetación. En este estudio, proponemos una metodología que utiliza una red generativa adversarial (GAN) para la traducción de imagen a imagen, con el objetivo de generar datos sintéticos de daños estructurales para aumentar el conjunto de datos. Inicialmente, se entrenó un modelo de generación de imágenes basado en GAN utilizando conjuntos de datos emparejados. Cuando se le proporcionó una imagen de máscara, este modelo generó una imagen RGB basada en las anotaciones. El paso siguiente generó imágenes de máscara específicas del dominio, una tarea crítica que mejoró el proceso de aumento de datos. Estas imágenes de máscara fueron diseñadas en función del conocimiento previo para adaptarse a las características y requisitos específicos del conjunto de datos de daños estructurales. Estas máscaras generadas fueron luego utilizadas por el modelo GAN para producir nuevos datos de imagen RGB incorporando varios tipos de daños. En la validación experimental realizada en los tres conjuntos de datos para evaluar la generación de imágenes para el aumento de datos, nuestros resultados demostraron que las imágenes generadas se asemejaban estrechamente a las imágenes reales mientras transmitían efectivamente información sobre el daño recién introducido. Además, la validación experimental de la detección de daños con datos aumentados implicó un análisis comparativo entre el rendimiento alcanzado únicamente con el conjunto de datos original y el obtenido con la incorporación de datos aumentados adicionales. Los resultados para la detección de daños demostraron consistentemente que la utilización de datos aumentados mejoró el rendimiento en comparación con depender únicamente de las imágenes originales.
Descripción
A medida que la tecnología avanza, el uso de vehículos aéreos no tripulados (VANT) y sensores de imagen para el monitoreo y diagnóstico estructural se vuelve cada vez más crítico. Este enfoque permite la inspección y evaluación eficiente de las condiciones estructurales. Además, se ha demostrado que la integración de técnicas de aprendizaje profundo es altamente efectiva para detectar daños a partir de imágenes estructurales, como se demuestra en nuestro estudio. Para permitir un aprendizaje efectivo por parte de los modelos de aprendizaje profundo, es crucial contar con un volumen sustancial de datos, pero la recolección de instancias apropiadas de daños estructurales en escenarios del mundo real presenta desafíos y exige conocimientos especializados, así como un tiempo y recursos significativos para la etiquetación. En este estudio, proponemos una metodología que utiliza una red generativa adversarial (GAN) para la traducción de imagen a imagen, con el objetivo de generar datos sintéticos de daños estructurales para aumentar el conjunto de datos. Inicialmente, se entrenó un modelo de generación de imágenes basado en GAN utilizando conjuntos de datos emparejados. Cuando se le proporcionó una imagen de máscara, este modelo generó una imagen RGB basada en las anotaciones. El paso siguiente generó imágenes de máscara específicas del dominio, una tarea crítica que mejoró el proceso de aumento de datos. Estas imágenes de máscara fueron diseñadas en función del conocimiento previo para adaptarse a las características y requisitos específicos del conjunto de datos de daños estructurales. Estas máscaras generadas fueron luego utilizadas por el modelo GAN para producir nuevos datos de imagen RGB incorporando varios tipos de daños. En la validación experimental realizada en los tres conjuntos de datos para evaluar la generación de imágenes para el aumento de datos, nuestros resultados demostraron que las imágenes generadas se asemejaban estrechamente a las imágenes reales mientras transmitían efectivamente información sobre el daño recién introducido. Además, la validación experimental de la detección de daños con datos aumentados implicó un análisis comparativo entre el rendimiento alcanzado únicamente con el conjunto de datos original y el obtenido con la incorporación de datos aumentados adicionales. Los resultados para la detección de daños demostraron consistentemente que la utilización de datos aumentados mejoró el rendimiento en comparación con depender únicamente de las imágenes originales.