Mscf-net: red de características de contexto de múltiples escalas guiada por atención para la segmentación de barcos en videos de vigilancia
Autores: Jiang, Xiaodan; Ding, Xiajun; Jiang, Xiaoliang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mscf-net: red de características de contexto de múltiples escalas guiada por atención para la segmentación de barcos en videos de vigilancia
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Inteligencia artificial
Segmentación de barcos
Sistemas de vigilancia marítima
Núcleos convolucionales
Agrupamiento piramidal espacial
Módulo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Con la llegada de la inteligencia artificial, la segmentación de barcos se ha convertido en un componente crítico en el desarrollo de sistemas inteligentes de vigilancia marítima. Sin embargo, debido al creciente número de barcos y al entorno de tráfico marítimo cada vez más complejo, las características objetivo en estas imágenes de barcos a menudo no son lo suficientemente claras, y los detalles clave no pueden identificarse claramente, lo que dificulta la tarea de segmentación. Para abordar estos problemas, presentamos un enfoque que aprovecha la tecnología de vanguardia para mejorar la precisión de la segmentación de barcos en entornos complejos. En primer lugar, empleamos un módulo de características contextuales multi-escala utilizando diferentes núcleos convolucionales para extraer un conjunto más rico de características semánticas de las imágenes. En segundo lugar, se integra un módulo mejorado de agrupamiento piramidal espacial (SPP) en la capa final del codificador, que expande significativamente el campo receptivo y captura un rango más amplio de información contextual. Además, introducimos un módulo de atención con una estructura multi-escala para obtener de manera efectiva las interacciones entre los procesos de codificación-decodificación y mejorar la capacidad de la red para intercambiar información entre capas. Finalmente, realizamos experimentos exhaustivos en los conjuntos de datos públicos SeaShipsSeg y MariBoatsSubclass de código abierto para validar la eficacia de nuestro enfoque. A través de estudios de ablación, demostramos la efectividad de cada componente individual y confirmamos su contribución al rendimiento general del sistema. Además, experimentos comparativos con algoritmos actuales de vanguardia mostraron que nuestro MSCF-Net destacó tanto en precisión como en robustez. Esta investigación proporciona una perspectiva innovadora que establece una base sólida para futuros avances en la precisión y rendimiento de las técnicas de segmentación de barcos.
Descripción
Con la llegada de la inteligencia artificial, la segmentación de barcos se ha convertido en un componente crítico en el desarrollo de sistemas inteligentes de vigilancia marítima. Sin embargo, debido al creciente número de barcos y al entorno de tráfico marítimo cada vez más complejo, las características objetivo en estas imágenes de barcos a menudo no son lo suficientemente claras, y los detalles clave no pueden identificarse claramente, lo que dificulta la tarea de segmentación. Para abordar estos problemas, presentamos un enfoque que aprovecha la tecnología de vanguardia para mejorar la precisión de la segmentación de barcos en entornos complejos. En primer lugar, empleamos un módulo de características contextuales multi-escala utilizando diferentes núcleos convolucionales para extraer un conjunto más rico de características semánticas de las imágenes. En segundo lugar, se integra un módulo mejorado de agrupamiento piramidal espacial (SPP) en la capa final del codificador, que expande significativamente el campo receptivo y captura un rango más amplio de información contextual. Además, introducimos un módulo de atención con una estructura multi-escala para obtener de manera efectiva las interacciones entre los procesos de codificación-decodificación y mejorar la capacidad de la red para intercambiar información entre capas. Finalmente, realizamos experimentos exhaustivos en los conjuntos de datos públicos SeaShipsSeg y MariBoatsSubclass de código abierto para validar la eficacia de nuestro enfoque. A través de estudios de ablación, demostramos la efectividad de cada componente individual y confirmamos su contribución al rendimiento general del sistema. Además, experimentos comparativos con algoritmos actuales de vanguardia mostraron que nuestro MSCF-Net destacó tanto en precisión como en robustez. Esta investigación proporciona una perspectiva innovadora que establece una base sólida para futuros avances en la precisión y rendimiento de las técnicas de segmentación de barcos.