Desplegando Agentes LLM Eficientes en Barcos de Superficie Autónomos Marítimos: Ajuste Fino, RAG y Llamadas a Funciones en un Modelo de Tamaño Mediano

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Desplegando Agentes LLM Eficientes en Barcos de Superficie Autónomos Marítimos: Ajuste Fino, RAG y Llamadas a Funciones en un Modelo de Tamaño Mediano

Autores: Ren, Yiling; Chen, Mozi; Weng, Junjie; Zhang, Shengkai; Xiao, Xuedou; Liu, Kezhong

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico

2026

Desplegando Agentes LLM Eficientes en Barcos de Superficie Autónomos Marítimos: Ajuste Fino, RAG y Llamadas a Funciones en un Modelo de Tamaño Mediano

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de lenguaje grandes

Barcos autónomos de superficie marítima

MARTIAN

Arquitectura de núcleo cognitivo

Inferencia táctica en tiempo real

Estudios de ablación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Desplegar Modelos de Lenguaje Grande (LLMs) en Barcos Autónomos de Superficie Marítima (MASS) implica una compensación crítica entre la profundidad de razonamiento, la latencia de inferencia y las limitaciones de hardware. Para llenar la brecha existente, introducimos MARTIAN (Agente Marítimo para Inferencia Táctica en Tiempo Real y Navegación), un agente de soporte de decisiones de 14 mil millones de parámetros diseñado para el despliegue en el borde en hardware de embarcaciones estándar (por ejemplo, el NVIDIA Jetson AGX Orin). Central a nuestro enfoque está la arquitectura del Núcleo Cognitivo, que utiliza un conjunto de datos verificado de 21,800 pares de instrucción-respuesta de Cadena de Pensamiento (CoT) para alinear las capacidades lingüísticas generales con la lógica procedimental marítima. Las evaluaciones empíricas demuestran que MARTIAN logra una precisión general del 73.23% (solo SFT) y del 81.16% (SFT + RAG) en el Cuestionario Bilingüe de Opción Múltiple Marítimo (BM-MCQ), un conjunto de datos de evaluación estandarizado construido en base a las competencias del Oficial de Guardia (OOW). Notablemente, la configuración solo SFT alcanza un 78.53% en tareas de COLREG intensivas en lógica pura, superando al modelo base Qwen-2.5 de 72 mil millones de parámetros en este dominio, mientras mantiene una latencia de inferencia en tiempo real de 22.4 ms/token. Crucialmente, nuestros estudios de ablación apoyan una Hipótesis de Interferencia matizada: mientras que RAG mejora significativamente el recuerdo factual en dominios intensivos en conocimiento (aumentando la precisión total del 73.23% al 81.16%), también introduce ruido semántico que degrada el rendimiento en tareas de razonamiento lógico puro (por ejemplo, la precisión en maniobras COLREG disminuye del 78.53% al 77.36%). Con base en este hallazgo, identificamos y motivamos empíricamente un principio de diseño cognitivo desacoplado que separa los reflejos procedimentales (a través de SFT) del conocimiento declarativo (a través de RAG). Si bien la implementación completa de un mecanismo de enrutamiento adaptativo se pospone para trabajos futuros, los resultados de ablación presentados aquí ofrecen una arquitectura de referencia validada y rentable para desplegar IA transparente y conforme a la regulación en embarcaciones mercantes con recursos limitados.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro