Segmentación de instancias de imágenes submarinas mediante el uso de aprendizaje profundo
Autores: Chen, Jianfeng; Zhu, Shidong; Luo, Weilin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Segmentación de instancias de imágenes submarinas mediante el uso de aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Segmentación de instancias de imágenes submarinas
Expansión del conjunto de datos
Red generativa adversaria
Algoritmo de mejora de imágenes
Cambio de color
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Basado en el aprendizaje profundo, se propone un método de segmentación de instancias de imágenes submarinas. Primero, ante la escasez de conjuntos de datos relacionados con el entorno submarino, se amplía el tamaño del conjunto de datos mediante medidas que incluyen la rotación y el volteo de imágenes, y la generación de imágenes mediante una red generativa adversaria (GAN). A continuación, el conjunto de datos de imágenes submarinas se construye finalmente mediante etiquetado manual. Luego, con el fin de resolver los problemas de cambio de color, desenfoque y el pobre contraste de las imágenes ópticas causados por el complejo entorno submarino y la atenuación y dispersión de la luz, se utiliza un algoritmo de mejora de imágenes submarinas para preprocesar primero el conjunto de datos, y se discuten varios algoritmos, incluido el Retinex multiescala (MSRCR) con recuperación de color, el modelo de color integrado (ICM), el estiramiento relativo del histograma global (RGHS) y la corrección de color no supervisada (UCM), así como la eliminación del cambio de color propuesto en este trabajo. Específicamente, los resultados indican que el método propuesto puede aumentar en gran medida el mAP (precisión promedio media) de segmentación en un 85,7% en comparación con no utilizar el método de pretratamiento. Además, basándose en las características del conjunto de datos submarinos construido, la red piramidal de características (FPN) se mejora en cierta medida, y el método de preprocesamiento se combina aún más con la red mejorada para experimentos y se compara con otras redes neuronales para verificar la efectividad del método propuesto, logrando así el efecto y propósito de mejorar la segmentación de instancias de imágenes submarinas y el reconocimiento de objetivos. Los resultados del análisis experimental muestran que el modelo propuesto puede lograr un mAP de 0.245, que es aproximadamente 1.1 veces mayor que otros modelos de reconocimiento de objetivos.
Descripción
Basado en el aprendizaje profundo, se propone un método de segmentación de instancias de imágenes submarinas. Primero, ante la escasez de conjuntos de datos relacionados con el entorno submarino, se amplía el tamaño del conjunto de datos mediante medidas que incluyen la rotación y el volteo de imágenes, y la generación de imágenes mediante una red generativa adversaria (GAN). A continuación, el conjunto de datos de imágenes submarinas se construye finalmente mediante etiquetado manual. Luego, con el fin de resolver los problemas de cambio de color, desenfoque y el pobre contraste de las imágenes ópticas causados por el complejo entorno submarino y la atenuación y dispersión de la luz, se utiliza un algoritmo de mejora de imágenes submarinas para preprocesar primero el conjunto de datos, y se discuten varios algoritmos, incluido el Retinex multiescala (MSRCR) con recuperación de color, el modelo de color integrado (ICM), el estiramiento relativo del histograma global (RGHS) y la corrección de color no supervisada (UCM), así como la eliminación del cambio de color propuesto en este trabajo. Específicamente, los resultados indican que el método propuesto puede aumentar en gran medida el mAP (precisión promedio media) de segmentación en un 85,7% en comparación con no utilizar el método de pretratamiento. Además, basándose en las características del conjunto de datos submarinos construido, la red piramidal de características (FPN) se mejora en cierta medida, y el método de preprocesamiento se combina aún más con la red mejorada para experimentos y se compara con otras redes neuronales para verificar la efectividad del método propuesto, logrando así el efecto y propósito de mejorar la segmentación de instancias de imágenes submarinas y el reconocimiento de objetivos. Los resultados del análisis experimental muestran que el modelo propuesto puede lograr un mAP de 0.245, que es aproximadamente 1.1 veces mayor que otros modelos de reconocimiento de objetivos.