Procesamiento del Lenguaje Predictivo en Humanos y Modelos de Lenguaje Grande: Un Estudio Comparativo de Dependencias Contextuales
Autores: Zhang, Yifan; Strelnikov, Kuzma
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Procesamiento del Lenguaje Predictivo en Humanos y Modelos de Lenguaje Grande: Un Estudio Comparativo de Dependencias Contextuales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de lenguaje
Señales contextuales
Rendimiento humano
Estructuras lingüísticas profundas
Arquitectura computacional
Procesamiento predictivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La comprensión del lenguaje humano se basa en el procesamiento predictivo; sin embargo, los mecanismos computacionales que subyacen a este fenómeno siguen siendo poco claros. Este estudio investiga estos mecanismos utilizando modelos de lenguaje grandes (LLMs), específicamente GPT-3.5-turbo y GPT-4. Realizamos una comparación del rendimiento de los LLM y de los humanos en una tarea de completación de frases bajo diferentes niveles de pistas contextuales (alto, medio y bajo) según lo definido por el rendimiento humano, lo que permite comparaciones directas entre IA y humanos. Nuestros hallazgos indican que los LLM superan significativamente a los humanos, particularmente en condiciones de contexto medio y bajo. Mientras que el éxito en escenarios de contexto medio refleja la utilización eficiente de la información contextual, el rendimiento en situaciones de bajo contexto, donde los LLM lograron aproximadamente un 25% de precisión en comparación con solo un 1% para los humanos, sugiere que los modelos aprovechan estructuras lingüísticas profundas más allá del mero contexto superficial. Este descubrimiento implica que los LLM pueden aclarar aspectos previamente desconocidos de la arquitectura del lenguaje. La capacidad de los LLM para explotar regularidades estructurales profundas y patrones estadísticos en contextos de baja y media predictibilidad ofrece una nueva perspectiva sobre la arquitectura computacional del sistema de lenguaje humano.
Descripción
La comprensión del lenguaje humano se basa en el procesamiento predictivo; sin embargo, los mecanismos computacionales que subyacen a este fenómeno siguen siendo poco claros. Este estudio investiga estos mecanismos utilizando modelos de lenguaje grandes (LLMs), específicamente GPT-3.5-turbo y GPT-4. Realizamos una comparación del rendimiento de los LLM y de los humanos en una tarea de completación de frases bajo diferentes niveles de pistas contextuales (alto, medio y bajo) según lo definido por el rendimiento humano, lo que permite comparaciones directas entre IA y humanos. Nuestros hallazgos indican que los LLM superan significativamente a los humanos, particularmente en condiciones de contexto medio y bajo. Mientras que el éxito en escenarios de contexto medio refleja la utilización eficiente de la información contextual, el rendimiento en situaciones de bajo contexto, donde los LLM lograron aproximadamente un 25% de precisión en comparación con solo un 1% para los humanos, sugiere que los modelos aprovechan estructuras lingüísticas profundas más allá del mero contexto superficial. Este descubrimiento implica que los LLM pueden aclarar aspectos previamente desconocidos de la arquitectura del lenguaje. La capacidad de los LLM para explotar regularidades estructurales profundas y patrones estadísticos en contextos de baja y media predictibilidad ofrece una nueva perspectiva sobre la arquitectura computacional del sistema de lenguaje humano.