MSG-GCN: Red de Convolución de Grafos Guiada por Múltiples Semánticas para el Reconocimiento de Comportamiento de Personas en el Agua en Sistemas de Drones Marítimos
Autores: Hang, Ruijie; He, Guiqing; Dong, Liheng
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
MSG-GCN: Red de Convolución de Grafos Guiada por Múltiples Semánticas para el Reconocimiento de Comportamiento de Personas en el Agua en Sistemas de Drones Marítimos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Drones
Ingeniería marítima
Reconocimiento de acciones
MSG-GCN
Interacción humano-drone
Características multimodales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los drones se están utilizando cada vez más en la ingeniería marítima para el mantenimiento de barcos, rescates de emergencia y tareas de monitoreo de seguridad. En estas tareas, el reconocimiento de acciones es importante para la interacción humano-drone y para detectar situaciones anormales como caídas o señales de socorro. Sin embargo, el entorno marítimo es altamente desafiante, con variaciones de iluminación, salpicaduras de agua y fondos dinámicos que a menudo conducen a ambigüedades entre acciones similares. Para abordar este problema, proponemos MSG-GCN, una red de convolución gráfica guiada por múltiples semánticas para el reconocimiento de acciones humanas. Específicamente, MSG-GCN integra información semántica estructurada previa y además introduce un mecanismo de alineación textual-semántica para mejorar la consistencia y expresividad de las características multimodales. Gracias a su diseño jerárquico ligero, nuestro modelo ofrece una excelente flexibilidad de implementación, lo que lo hace muy adecuado para aplicaciones de UAV con recursos limitados. Los resultados experimentales en conjuntos de datos de referencia a gran escala, incluidos NTU60, NTU120 y UAV-humano, demuestran que MSG-GCN supera a los métodos de última generación tanto en precisión de clasificación como en eficiencia computacional.
Descripción
Los drones se están utilizando cada vez más en la ingeniería marítima para el mantenimiento de barcos, rescates de emergencia y tareas de monitoreo de seguridad. En estas tareas, el reconocimiento de acciones es importante para la interacción humano-drone y para detectar situaciones anormales como caídas o señales de socorro. Sin embargo, el entorno marítimo es altamente desafiante, con variaciones de iluminación, salpicaduras de agua y fondos dinámicos que a menudo conducen a ambigüedades entre acciones similares. Para abordar este problema, proponemos MSG-GCN, una red de convolución gráfica guiada por múltiples semánticas para el reconocimiento de acciones humanas. Específicamente, MSG-GCN integra información semántica estructurada previa y además introduce un mecanismo de alineación textual-semántica para mejorar la consistencia y expresividad de las características multimodales. Gracias a su diseño jerárquico ligero, nuestro modelo ofrece una excelente flexibilidad de implementación, lo que lo hace muy adecuado para aplicaciones de UAV con recursos limitados. Los resultados experimentales en conjuntos de datos de referencia a gran escala, incluidos NTU60, NTU120 y UAV-humano, demuestran que MSG-GCN supera a los métodos de última generación tanto en precisión de clasificación como en eficiencia computacional.