logo móvil
Contáctanos

Desplegando Agentes LLM Eficientes en Barcos de Superficie Autónomos Marítimos: Ajuste Fino, RAG y Llamadas a Funciones en un Modelo de Tamaño Mediano

Autores: Ren, Yiling; Chen, Mozi; Weng, Junjie; Zhang, Shengkai; Xiao, Xuedou; Liu, Kezhong

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Desplegando Agentes LLM Eficientes en Barcos de Superficie Autónomos Marítimos: Ajuste Fino, RAG y Llamadas a Funciones en un Modelo de Tamaño Mediano


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de lenguaje grandes
Barcos autónomos de superficie marítima
MARTIAN
Arquitectura de núcleo cognitivo
Inferencia táctica en tiempo real
Estudios de ablación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Desplegar Modelos de Lenguaje Grande (LLMs) en Barcos Autónomos de Superficie Marítima (MASS) implica una compensación crítica entre la profundidad de razonamiento, la latencia de inferencia y las limitaciones de hardware. Para llenar la brecha existente, introducimos MARTIAN (Agente Marítimo para Inferencia Táctica en Tiempo Real y Navegación), un agente de soporte de decisiones de 14 mil millones de parámetros diseñado para el despliegue en el borde en hardware de embarcaciones estándar (por ejemplo, el NVIDIA Jetson AGX Orin). Central a nuestro enfoque está la arquitectura del Núcleo Cognitivo, que utiliza un conjunto de datos verificado de 21,800 pares de instrucción-respuesta de Cadena de Pensamiento (CoT) para alinear las capacidades lingüísticas generales con la lógica procedimental marítima. Las evaluaciones empíricas demuestran que MARTIAN logra una precisión general del 73.23% (solo SFT) y del 81.16% (SFT + RAG) en el Cuestionario Bilingüe de Opción Múltiple Marítimo (BM-MCQ), un conjunto de datos de evaluación estandarizado construido en base a las competencias del Oficial de Guardia (OOW). Notablemente, la configuración solo SFT alcanza un 78.53% en tareas de COLREG intensivas en lógica pura, superando al modelo base Qwen-2.5 de 72 mil millones de parámetros en este dominio, mientras mantiene una latencia de inferencia en tiempo real de 22.4 ms/token. Crucialmente, nuestros estudios de ablación apoyan una Hipótesis de Interferencia matizada: mientras que RAG mejora significativamente el recuerdo factual en dominios intensivos en conocimiento (aumentando la precisión total del 73.23% al 81.16%), también introduce ruido semántico que degrada el rendimiento en tareas de razonamiento lógico puro (por ejemplo, la precisión en maniobras COLREG disminuye del 78.53% al 77.36%). Con base en este hallazgo, identificamos y motivamos empíricamente un principio de diseño cognitivo desacoplado que separa los reflejos procedimentales (a través de SFT) del conocimiento declarativo (a través de RAG). Si bien la implementación completa de un mecanismo de enrutamiento adaptativo se pospone para trabajos futuros, los resultados de ablación presentados aquí ofrecen una arquitectura de referencia validada y rentable para desplegar IA transparente y conforme a la regulación en embarcaciones mercantes con recursos limitados.

Otros recursos que podrían interesarte

Temas Virtualpro